-
Data: 2020-03-22 20:34:25
Temat: Re: Wydajność OpenCL
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On Wednesday, March 18, 2020 at 1:34:38 PM UTC+1, M.M. wrote:
> Napisałem i uruchomiłem minimalistyczny programik w
> OpenCL żeby zobaczyć, jakie w praktyce można uzyskać przyspieszenie.
>
> Program wykonywał obliczenia minimalistyczne na int32, byle
> coś liczył, link do kodu:
> https://github.com/mmarszik/OpenCLArrProcess00
>
> U mnie OpenCL działa 67 razy szybciej względem obliczeń na jednym
> rdzeniu procesora, czyli względem całego procesora około 30 razy.
> Procesor i5, GPU: intel HD 5500. Czyli na przeciętnej karcie
> graficznej (np. gtx 1650, która zużywa tylko 75wat mocy) można
> uzyskać przyspieszenie 450 razy względem procesora i5, a na
> najnowszych GPU około 1150 razy i 30 razy względem najnowszych
> procesorów (takich jak AMD Ryzen Threadripper 3990X)
>
> Prawdę powiedziawszy, myślałem że przyspieszenie będzie w
> granicach 50-100 razy jeśli GPU i CPU są w tej samej klasie
> cenowej.
>
> Może obliczenia dotyczyczące grafiki 2-3D by dały przyspieszenie
> rzędu 50-100 razy. Ciekawe też, dlaczego jak coś renderuję w
> blenderze to przyspieszenie mam nie większe niż 10 razy. Pewnym
> mankamentem jest to, że procesor może mieć dziś (łatwo i tanio) dostęp
> do np. 128GB RAM, a GPU rzadko ma powyżej 8GB, ale za to do jednej płyty
> głównej można podpiąć dużo GPU (już widziałem 8).
>
>
> Tu więcej o sprzęcie na jakim uruchomiłem test:
>
>
> cat /proc/cpuinfo
> processor : 0
> vendor_id : GenuineIntel
> cpu family : 6
> model : 61
> model name : Intel(R) Core(TM) i5-5200U CPU @ 2.20GHz
> stepping : 4
> microcode : 0x2e
> cpu MHz : 1093.559
> cache size : 3072 KB
> ...............................
>
>
> lshw -C display
> *-display
> description: VGA compatible controller
> product: HD Graphics 5500
> vendor: Intel Corporation
> physical id: 2
> bus info: pci@0000:00:02.0
> version: 09
> width: 64 bits
> clock: 33MHz
> capabilities: msi pm vga_controller bus_master cap_list rom
> configuration: driver=i915 latency=0
> resources: irq:48 memory:c0000000-c0ffffff memory:b0000000-bfffffff
ioport:5000(size=64) memory:c0000-dffff
Zrobiłem jeszcze jedne test. Porównałem procesor AMD Phenom II (6 rdzeni) z
kartą GTX 1650. GTZ 1650 działa 260 razy szybciej. Ani karta, ani procesor
nie były podkręcane. Jako ciekawostkę dodam, że karta pobiera (według
producenta) 75W mocy, a procesor nawet 200. Wniosek z tego taki, że jeśli
jakieś obliczenia w ogóle można przeprowadzić na GPU, to przyspieszenie
może być kolosalne. Jeśli podłączymy 8 takich kart do płyty głównej to
mamy przyspieszenie 2080 razy.
Jakby użyć jakiś wbudowanych funkcji z OpenCL do przetwarzania grafiki, to
przyspieszenie byłoby pewnie jeszcze większe - ciekawe jakie, ma ktoś takie
doświadczenia?
I kolejna sprawa, jeśli na procesorze (GPU) przeznaczonym do ogólnych obliczeń
można uzyskać przyspieszenie 260 razy, to jakiego przyspieszenia
można się spodziewać na układach FPGA i ASIC?
Pozdrawiam
Następne wpisy z tego wątku
- 23.03.20 00:53 fir
- 23.03.20 01:37 M.M.
- 24.03.20 18:58 heby
- 24.03.20 21:19 M.M.
- 24.03.20 21:35 heby
- 26.03.20 11:53 M.M.
- 26.03.20 12:12 Mateusz Viste
- 26.03.20 12:37 fir
- 26.03.20 12:40 fir
- 26.03.20 13:57 M.M.
- 26.03.20 14:22 fir
- 26.03.20 18:24 heby
- 26.03.20 18:57 M.M.
Najnowsze wątki z tej grupy
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
Najnowsze wątki
- 2026-01-01 szyby macie całe?
- 2026-01-01 Najbogatsi ludzie na świecie są jeszcze bogatsi. Bezprecedensowa skala zysków
- 2026-01-01 Najbogatsi ludzie na świecie są jeszcze bogatsi. Bezprecedensowa skala zysków
- 2026-01-01 Wszystkiego najlepszego
- 2025-12-31 Czy potrafisz wskazać różnice? [TVN v. RMF]
- 2025-12-31 I kolejny jebnięty
- 2025-12-31 Myślenice => Specjalista ds. kontrolingu <=
- 2025-12-31 Ostróda szlachetnie walczy
- 2025-12-31 Pierwsza mapa kosmosu w 102 długościach fal podczerwieni! To początek nowej ery w astronomii
- 2025-12-31 Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- 2025-12-31 Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- 2025-12-31 Pieniadze-cuchna-oddechem-nawalonego-tatusia
- 2025-12-31 Iran na skraju gospodarczego upadku. Na ulicach Teheranu (znów) wrze. To może być cios dla reżimu
- 2025-12-30 zasilacz
- 2025-12-30 Teraz System Plików PFS z sys. op. Amiga OS będziesz mógł zamontować pod sys. op. Linuks i Jabłoko Makintosz




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]