-
11. Data: 2010-08-01 13:23:51
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Bronek Kozicki <b...@s...net>
On 01/08/10 02:14, Mariusz Marszałkowski wrote:
> On 31 Lip, 15:29, Bronek Kozicki<b...@s...net> wrote:
>> On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
>>
>>> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
>>> prostu całego zakresu.
>>
>> Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
>> skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
>> wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
>>
> Właśnie tego nie wiem jak to szybko się wykona na GPU. Czy jest
> możliwe zwiększenie wydajności o teoretyczny współczynnik 60 razy?
http://portal.acm.org/beta/citation.cfm?id=1816021&c
oll=GUIDE&dl=GUIDE&CFID=94608761&CFTOKEN=50783980&re
t=1
bedziesz musiał wydac $15 (albo skorzystac z członkowstwa w ACM)
B.
-
12. Data: 2010-08-01 15:52:43
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Mariusz Marszałkowski <m...@g...com>
On 1 Sie, 15:23, Bronek Kozicki <b...@s...net> wrote:
> On 01/08/10 02:14, Mariusz Marszałkowski wrote:
>
> > On 31 Lip, 15:29, Bronek Kozicki<b...@s...net> wrote:
> >> On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
>
> >>> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
> >>> prostu całego zakresu.
>
> >> Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
> >> skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
> >> wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
>
> > Właśnie tego nie wiem jak to szybko się wykona na GPU. Czy jest
> > możliwe zwiększenie wydajności o teoretyczny współczynnik 60 razy?
>
> http://portal.acm.org/beta/citation.cfm?id=1816021&c
oll=GUIDE&dl=GUID...
>
> bedziesz musiał wydac $15 (albo skorzystac z członkowstwa w ACM)
>
> B.
Nie wiem czy dobrze rozumiem... Zdaniem autorów dobrze zoptymalizowany
kod na GTX280 działa zaledwie 2.5 razy szybciej od dobrze
zoptymalizowanego
kodu na i7 920? GTX280 wg Wikipedii ma 550GFLOPS-ów. Dziwne...
Pozdrawiam
-
13. Data: 2010-08-01 16:30:12
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Piotr Chamera <p...@p...onet.pl>
W dniu 2010-08-01 17:52, Mariusz Marszałkowski pisze:
> On 1 Sie, 15:23, Bronek Kozicki<b...@s...net> wrote:
>> On 01/08/10 02:14, Mariusz Marszałkowski wrote:
>>
>>> On 31 Lip, 15:29, Bronek Kozicki<b...@s...net> wrote:
>>>> On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
>>
>>>>> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
>>>>> prostu całego zakresu.
>>
>>>> Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
>>>> skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
>>>> wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
>>
>>> Właśnie tego nie wiem jak to szybko się wykona na GPU. Czy jest
>>> możliwe zwiększenie wydajności o teoretyczny współczynnik 60 razy?
>>
>> http://portal.acm.org/beta/citation.cfm?id=1816021&c
oll=GUIDE&dl=GUID...
>>
>> bedziesz musiał wydac $15 (albo skorzystac z członkowstwa w ACM)
>>
>> B.
>
> Nie wiem czy dobrze rozumiem... Zdaniem autorów dobrze zoptymalizowany
> kod na GTX280 działa zaledwie 2.5 razy szybciej od dobrze
> zoptymalizowanego
> kodu na i7 920? GTX280 wg Wikipedii ma 550GFLOPS-ów. Dziwne...
Nie mam dostępu do artykułu, więc mogę tylko zgadywać, że problem
nie leży w mocy obliczeniowej procesorów, tylko w odpowiednio szybkim
dostarczeniu im danych do obliczeń - przy bardzo wielu procesorach
wąskim gardłem jest zwykle dostęp do pamięci dzielonej lub komunikacja
między procesorami.