- 
Data: 2012-03-03 15:44:10
 Temat: Re: OpenMP - jest szybciej czy wolniej?
 Od: Edek Pienkowski <e...@g...com> szukaj wiadomości tego autora
 [ pokaż wszystkie nagłówki ]Dnia Sat, 03 Mar 2012 11:13:08 +0100, slawek napisal: 
 
 > Użytkownik <f...@N...gazeta.pl> napisał w wiadomości grup
 > dyskusyjnych:jisdma$441$...@i...gazeta.pl...
 >> mz wiadomo a przynajmniej bezpieczniej jest zakladac ze koszt
 >> owatkowienia moze byc spory, mi nie podoba sie watkowa rozrzutnosc,
 >
 > Właśnie w tym cały wic:
 >
 > 1. OpenMP "podręcznikowo" stosuje się tak:
 >
 > !$omp parallel do do i = 1,N
 > ! ... robota do wykonania
 > end do !$omp end parallel do
 
 OpenMP pozwala robić przede wszystkim coarse-grained, fine-grained może
 i też, ale twoje pętla jest "mikro". Zrób zewnętrzną/wewnętrzną.
 
 
 >
 > Mimo tej sztuczki - program nadal jest 2x _wolniejszy_ niż
 > jednowątkowy
 > (był nawet 35 razy wolniejszy). A powinien być 2x szybszy. Dziwne.
 
 No i będzie 2x szybszy. OpenMP nie zwalnia od myślenia. Chcesz coś
 prostszego: Thrust. Ma backend openMP, ma backend CUDA, używa
 się tak prosto, jak stl::transform, z Fortrana chyba też się da.
 Jak przy pomocy Thrust uda ci się spieprzyć, chylę czoła ;)
 
 >
 > 3. Myślę, że takie coś będzie szło od strony GPU - Intel "wsadził" GPU
 > do CPU - więc pewnie da się - tam powinno być około 1000 rdzeni... to
 > zupełnie nowy horyzont.
 
 GPU działa inaczej. Taka pętla będzie "memory-bound", za mało liczenia.
 W przypadku GPU mówi się o przepustowości, i generalnie przepustowość
 obliczeniowa karty jest rzędu 8-10 x większa niż przepustowość
 pamięci, do tego z pamięci trzeba odczytać i jeszcze zapisać wynik.
 Fakt, że GPU mają lepszą przepustowość pamięci niż procek, ale znowu:
 wszystko memory-bound musi mieć odpowiednie dostępy do pamięci, albo
 będzie strasznie wolne. Zobacz Thrust, oni zrobili to dobrze, sam z takim
 podejściem spieprzysz koncertowo i będzie jeszcze wolniejsze.
 
 Nie wiem, co Intel (i AMD) zrobią naprawdę mieszając CPU i GPU. Widziałem
 te architektury, ale nie powiem, żebym znał ich właściwości. Nie liczyłbym
 też na to, że 1000 rdzeni: rdzenie GPU są inne i nie są niezależne;
 no i rdzenie Intela to nie rdzenie Nvidii czy ATI. Ale mix może być fajny.
 
 >
 >> - tak naprawde zeby zobaczyc co sie dzieje trzebeby zobaczyc i umiec
 >> zrozumiec kod schedulera i okolic w kernelu - warto by to bylo po
 >> prostu obejrzec (zob watek jadro jadra)
 
 Ta, schedulera. W przypadku dwóch wątków na dwucorowym procku scheduler
 nie ma nic do gadania.
 
 >
 > 4. Znowu przypomnę - OpenMP miał być sposobem na
 > "łatwo-prosto-i-przyjemnie". Jak mam wgłębiać się w kod kernela - to
 > trudno mówić, że jest prosto.
 >
 > 5. Czyli podsumowując - cały ten OpenMP jest mocno do niczego -
 > wydajność SPADA - a w dodatku trzeba mocno uważać, aby zrobić działający
 > program.
 
 OpenMP jest fajny, RTFM. Trolujesz, czy serio narzekasz?
 
 >
 > 6. Punkt 5. odnosi się do "przeciętnego PC mającego 1 procesor z
 > niewieloma rdzeniami". Być może gdyby tych rdzeni było więcej... ale,
 > ale, na 16 też było kiepsko.
 
 Bo spieprzyłeś. Gcc wektoryzuje pętle. Jak masz task z 1 iteracją
 może mieć problem (też bym liczył na to, że sobie poradzi, ale
 nie wszystkie optymalizacje zawsze działają). Zresztą:
 
 weź Thrust. Jest zrobiony właśnie dla ludzi, którzy nie kumają co to GPU,
 co to OpenMP i chcą coś szybko policzyć. Przepisanie twojej pętli to
 5 minut, używa się tego bardzo prosto. Gratis będzie działało na GPU,
 ale nie oczekiwałbym wielkich zysków jeżeli nie masz takiego "nowego
 procka CPU/GPU, który by jeszcze wspierał CC 2.0", bo na GPU trzeba
 dane dodatkowo przekopiować i przekopiować wyniki, do tego pewne latency
 wykonania dochodzi (rzędu 1ms).
 
 Edek
 
 
 
Następne wpisy z tego wątku
- 03.03.12 15:49 Edek Pienkowski
- 03.03.12 15:53
- 03.03.12 16:12 slawek
- 03.03.12 16:29 Edek Pienkowski
- 03.03.12 21:29
- 03.03.12 21:33 M.M.
- 03.03.12 23:13 slawek
- 04.03.12 05:46 M.M.
- 04.03.12 10:29 Roman W
- 04.03.12 11:13
- 05.03.12 11:02 Roman W
- 05.03.12 15:14 M.M.
- 05.03.12 18:33 slawek
- 05.03.12 18:42 fir kenobi
- 05.03.12 18:48 slawek
Najnowsze wątki z tej grupy
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-10-29 szablon do pasty DIY
- 2025-10-29 Głośnik potrzebny
- 2025-10-29 Warszawa => Specjalista rekrutacji IT <=
- 2025-10-29 Rzeszów => International Freight Forwarder <=
- 2025-10-29 Białystok => Gen AI Engineer <=
- 2025-10-29 Warszawa => Fullstack PHP Developer <=
- 2025-10-29 Warszawa => BI Developer / Analityk BI <=
- 2025-10-29 Warszawa => Engineering Manager (doświadczenie w branży lotniczej lu
- 2025-10-29 Warszawa => Generative AI Engineer <=
- 2025-10-28 Berkowicz kwalifikacja prawna czyli poseł opozycji w IKEA
- 2025-10-28 Silikonowy przewód ekranowany
- 2025-10-28 Wtyk bananowy ekranowany
- 2025-10-28 Chiny => Koordynator Produkcji / Przedstawiciel ds. rozwoju produktu <
- 2025-10-28 Warszawa => BI Developer <=
- 2025-10-28 Warszawa => Engineering Manager <=




![Linki sponsorowane, dofollow, nofollow. Jak wykorzystać linkowanie w reklamie? [© bf87 - Fotolia.com] Linki sponsorowane, dofollow, nofollow. Jak wykorzystać linkowanie w reklamie?](https://s3.egospodarka.pl/grafika2/linki-sponsorowane/Linki-sponsorowane-dofollow-nofollow-Jak-wykorzystac-linkowanie-w-reklamie-216282-150x100crop.jpg) 
![Dlaczego firmom opłaca się korzystać z kantorów internetowych? [© Halfpoint - Fotolia.com] Dlaczego firmom opłaca się korzystać z kantorów internetowych?](https://s3.egospodarka.pl/grafika2/wymiana-walut/Dlaczego-firmom-oplaca-sie-korzystac-z-kantorow-internetowych-219575-150x100crop.jpg) 
![Kiedy wysłać mailing? Jaki dzień tygodnia i godziny są najlepsze [© ra2 studio - fotolia.com] Kiedy wysłać mailing? Jaki dzień tygodnia i godziny są najlepsze](https://s3.egospodarka.pl/grafika2/mailing/Kiedy-wyslac-mailing-Jaki-dzien-tygodnia-i-godziny-sa-najlepsze-223622-150x100crop.jpg) 
![Praca zdalna po nowelizacji Kodeksu pracy - korzyści i obowiązki [© pixabay.com] Praca zdalna po nowelizacji Kodeksu pracy - korzyści i obowiązki](https://s3.egospodarka.pl/grafika2/praca-zdalna/Praca-zdalna-po-nowelizacji-Kodeksu-pracy-korzysci-i-obowiazki-250502-150x100crop.jpg) 
 Zalety drzwi aluminiowych w nowoczesnych projektach architektonicznych
Zalety drzwi aluminiowych w nowoczesnych projektach architektonicznych 
 
 
 
![Hydroizolacja balkonu: najczęstsze błędy i sprawdzone rozwiązania [© pixabay] Hydroizolacja balkonu: najczęstsze błędy i sprawdzone rozwiązania](https://s3.egospodarka.pl/grafika2/hydroizolacja/Hydroizolacja-balkonu-najczestsze-bledy-i-sprawdzone-rozwiazania-269373-150x100crop.jpg) 
![PREMIERA Ford Ranger PHEV [© Wojciech Krzemiński] PREMIERA Ford Ranger PHEV](https://s3.egospodarka.pl/grafika2/Ford-Ranger-PHEV/PREMIERA-Ford-Ranger-PHEV-269363-150x100crop.jpg) 
![5 kluczowych błędów lidera, które budują dojrzałe przywództwo [© wygenerowane przez AI] 5 kluczowych błędów lidera, które budują dojrzałe przywództwo](https://s3.egospodarka.pl/grafika2/dobry-lider/5-kluczowych-bledow-lidera-ktore-buduja-dojrzale-przywodztwo-269360-150x100crop.jpg) 
![Sąd ogłosił upadłość Cinkciarz.pl - co to oznacza dla wierzycieli? [© wygenerowane przez AI] Sąd ogłosił upadłość Cinkciarz.pl - co to oznacza dla wierzycieli?](https://s3.egospodarka.pl/grafika2/Cinkciarz-pl/Sad-oglosil-upadlosc-Cinkciarz-pl-co-to-oznacza-dla-wierzycieli-269359-150x100crop.png) 
 
![Seniorzy na rynku pracy - jak zmienia się zatrudnienie osób po 60. roku życia? [© wygenerowane przez AI] Seniorzy na rynku pracy - jak zmienia się zatrudnienie osób po 60. roku życia?](https://s3.egospodarka.pl/grafika2/zatrudnianie-osob-starszych/Seniorzy-na-rynku-pracy-jak-zmienia-sie-zatrudnienie-osob-po-60-roku-zycia-269358-150x100crop.jpg) 


