-
Data: 2020-03-21 11:17:25
Temat: Re: Wydajność OpenCL
Od: fir <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu środa, 18 marca 2020 13:34:38 UTC+1 użytkownik M.M. napisał:
> Napisałem i uruchomiłem minimalistyczny programik w
> OpenCL żeby zobaczyć, jakie w praktyce można uzyskać przyspieszenie.
>
> Program wykonywał obliczenia minimalistyczne na int32, byle
> coś liczył, link do kodu:
> https://github.com/mmarszik/OpenCLArrProcess00
>
> U mnie OpenCL działa 67 razy szybciej względem obliczeń na jednym
> rdzeniu procesora, czyli względem całego procesora około 30 razy.
> Procesor i5, GPU: intel HD 5500. Czyli na przeciętnej karcie
> graficznej (np. gtx 1650, która zużywa tylko 75wat mocy) można
> uzyskać przyspieszenie 450 razy względem procesora i5, a na
> najnowszych GPU około 1150 razy i 30 razy względem najnowszych
> procesorów (takich jak AMD Ryzen Threadripper 3990X)
>
> Prawdę powiedziawszy, myślałem że przyspieszenie będzie w
> granicach 50-100 razy jeśli GPU i CPU są w tej samej klasie
> cenowej.
>
> Może obliczenia dotyczyczące grafiki 2-3D by dały przyspieszenie
> rzędu 50-100 razy. Ciekawe też, dlaczego jak coś renderuję w
> blenderze to przyspieszenie mam nie większe niż 10 razy. Pewnym
> mankamentem jest to, że procesor może mieć dziś (łatwo i tanio) dostęp
> do np. 128GB RAM, a GPU rzadko ma powyżej 8GB, ale za to do jednej płyty
> głównej można podpiąć dużo GPU (już widziałem 8).
>
>
> Tu więcej o sprzęcie na jakim uruchomiłem test:
>
>
> cat /proc/cpuinfo
> processor : 0
> vendor_id : GenuineIntel
> cpu family : 6
> model : 61
> model name : Intel(R) Core(TM) i5-5200U CPU @ 2.20GHz
> stepping : 4
> microcode : 0x2e
> cpu MHz : 1093.559
> cache size : 3072 KB
> ...............................
>
>
> lshw -C display
> *-display
> description: VGA compatible controller
> product: HD Graphics 5500
> vendor: Intel Corporation
> physical id: 2
> bus info: pci@0000:00:02.0
> version: 09
> width: 64 bits
> clock: 33MHz
> capabilities: msi pm vga_controller bus_master cap_list rom
> configuration: driver=i915 latency=0
> resources: irq:48 memory:c0000000-c0ffffff memory:b0000000-bfffffff
ioport:5000(size=64) memory:c0000-dffff
mw potwierdza to moje wyobrazenie/oszaowania jakie sobie wyrobilem na podstawie moich
testow i czytania netu pare lat temu
w pewnym sensie sa to dobre wiesci bo znaczy ze jak ktos bardzo potrzebuje tej mocy
obliczeniowej to moze z kart pewnie aporo wycisnac
co prawda ja dodam nie spoedziewalbym sie
50-100 x wiekszej mocy w kategoriach 'tej samej polki cenowej' raczej bym sie
sposdziewal powiedzmy 5-27 ale to tez jest sporo
kwestia jest jednak tak czym sie kto zajmuje jesli ja zajmuje sie ogolnym
programowaniem to teraz dla mnei bardziej liczy sie prostota, wygioda i 'krzepkosc'
programu i programowania niz optymalizacje (nawet ciekawych, naukowych) hello worldów
obecnie nieststy wlacze z wlasną motywacja, kalendażem na scianie i problemami
zdrowotno zyciowymi
(a jak juz nad czyms pracuje to troche dropnalem ambitniejsze projekty 2d/3d
i jak juz to zajmuje sie swoimi prostymi
tematami asemblerem, kompilatorem i edytorem kodu - bo sa to w porownaniu z ambitnymi
rzeczami w sumie rzeczy wzglednie proste, i jak widac niewiele do nich trzeba (poza
tonami motywacji))
Następne wpisy z tego wątku
- 21.03.20 21:10 M.M.
- 21.03.20 23:05 M.M.
- 22.03.20 20:34 M.M.
- 23.03.20 00:53 fir
- 23.03.20 01:37 M.M.
- 24.03.20 18:58 heby
- 24.03.20 21:19 M.M.
- 24.03.20 21:35 heby
- 26.03.20 11:53 M.M.
- 26.03.20 12:12 Mateusz Viste
- 26.03.20 12:37 fir
- 26.03.20 12:40 fir
- 26.03.20 13:57 M.M.
- 26.03.20 14:22 fir
- 26.03.20 18:24 heby
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-27 OT musk
- 2025-01-27 Bydgoszcz => Specjalista ds. Sprzedaży (transport drogowy) <=
- 2025-01-27 Warszawa => Java Developer <=
- 2025-01-27 Warszawa => Data Engineer (Tech Lead) <=
- 2025-01-27 Warszawa => Programista Full Stack (.Net Core) <=
- 2025-01-27 Kto ma PRAWNĄ rację? poseł KO mec. R. Giertych v. mec. B. Lewandowski
- 2025-01-27 Gliwice => IT Expert (Network Systems area) <=
- 2025-01-27 Koszyk okrągły, walec 3x AA, na duże paluszki R6
- 2025-01-27 Warszawa => QA Engineer <=
- 2025-01-27 Warszawa => Analityk Biznesowo-Systemowy <=
- 2025-01-27 Mińsk Mazowiecki => Area Sales Manager OZE <=
- 2025-01-27 Bieruń => Team Lead / Tribe Lead FrontEnd <=
- 2025-01-27 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-01-27 Kraków => User Experience Designer <=
- 2025-01-27 Kraków => iOS Developer (Swift experience) <=