-
Data: 2012-03-03 12:30:32
Temat: Re: OpenMP - jest szybciej czy wolniej?
Od: " " <f...@N...gazeta.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]slawek <s...@h...pl> napisał(a):
>
> Użytkownik <f...@N...gazeta.pl> napisał w wiadomości grup
> dyskusyjnych:jisdma$441$...@i...gazeta.pl...
> > mz wiadomo a przynajmniej bezpieczniej jest zakladac ze koszt
> > owatkowienia moze byc spory, mi nie podoba sie watkowa rozrzutnosc,
>
> Właśnie w tym cały wic:
>
> 1. OpenMP "podręcznikowo" stosuje się tak:
>
> !$omp parallel do
> do i = 1,N
> ! ... robota do wykonania
> end do
> !$omp end parallel do
>
> tymczasem narzut na utworzenie wątków jest paskudnie duży i opłaca się
> robić tak
>
> !$omp parallel
>
> !$omp master
> ! ... część jednowątkowa
> !$omp end master
>
> !$omp do
> do i = 1,N
> /* robota do wykonania */
> end do
> !$omp end do
>
> ...
> !$omp parallel
>
> ale o tym "ludzie od OpenMP" milczą w swoich zaangażowanych
> prezentacjach i przykładach.
>
> Mimo tej sztuczki - program nadal jest 2x _wolniejszy_ niż
jednowątkowy
> (był nawet 35 razy wolniejszy). A powinien być 2x szybszy. Dziwne.
>
> 2. OpenMP miał być (jest?! wątpię!) sposobem na łatwie-i-przyjemne
> wprowadzenie wielowątkowości dla usprawnienia obliczeń numerycznych.
>
> > - byc moze tak naprawde systemy mozna by robic zupelnie inaczej
> > trzebaby kiedys przemyslec podstawy wielowątkowosci
>
> 3. Myślę, że takie coś będzie szło od strony GPU - Intel "wsadził" GPU do
> CPU - więc pewnie da się - tam powinno być około 1000 rdzeni... to zupełnie
> nowy horyzont.
>
> > - tak naprawde zeby zobaczyc co sie dzieje trzebeby zobaczyc
> > i umiec zrozumiec kod schedulera i okolic w kernelu - warto
> > by to bylo po prostu obejrzec (zob watek jadro jadra)
>
> 4. Znowu przypomnę - OpenMP miał być sposobem na
> "łatwo-prosto-i-przyjemnie". Jak mam wgłębiać się w kod kernela - to trudno
> mówić, że jest prosto.
>
> 5. Czyli podsumowując - cały ten OpenMP jest mocno do niczego - wydajność
> SPADA - a w dodatku trzeba mocno uważać, aby zrobić działający program.
>
> 6. Punkt 5. odnosi się do "przeciętnego PC mającego 1 procesor z niewieloma
> rdzeniami". Być może gdyby tych rdzeni było więcej... ale, ale, na 16 też
> było kiepsko.
>
ogolnie sie zgadzam - tak to jest, (moze tak byc,
zasadniczo jednak kombinujac powinno sie dac osiagnac
pod 200% na dwu prockach pod 400% na czterech pod 800% na
osmiu 1600% na 16stu itp -
o ile sie faktycznie NIE DA to cos jest zepsute - ale
nie wiem czy owo openmp gwarantuje ze przy jego pomocy
da sie to osiagnac dla wszystkich kodów (?) czy tylko dla
niektorych
- jesli nnie da sie tego 1600% osiagnac w openmp to powinno
dac innymi sposobami zwiazanymi z mt, a jesli nie da sie
tego siagnac i innymi sposobami to te techniki są z kolei
zepsute bo powinny to umozliwiac - prosta sprawa
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 03.03.12 12:49 slawek
- 03.03.12 12:57 slawek
- 03.03.12 13:12
- 03.03.12 13:32 slawek
- 03.03.12 14:39
- 03.03.12 15:08 slawek
- 03.03.12 15:44 Edek Pienkowski
- 03.03.12 15:49 Edek Pienkowski
- 03.03.12 15:53
- 03.03.12 16:12 slawek
- 03.03.12 16:29 Edek Pienkowski
- 03.03.12 21:29
- 03.03.12 21:33 M.M.
- 03.03.12 23:13 slawek
- 04.03.12 05:46 M.M.
Najnowsze wątki z tej grupy
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
Najnowsze wątki
- 2025-04-26 e-Doręczenia w praktyce.
- 2025-04-26 Warszawa => Konsultant Wiodący SAP PP <=
- 2025-04-26 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36
- 2025-04-26 Warszawa => Programista Microsoft Dynamics 365 Finance & Operations (D
- 2025-04-26 Środa Wielkopolska => SAP FI/CO Internal Consultant <=
- 2025-04-26 Patrole obywatelskie.
- 2025-04-26 Warszawa => Presales Engineer IT <=
- 2025-04-26 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-04-26 Rudno => IT network administrator <=
- 2025-04-26 Dęblin => Node.js / Fullstack Developer <=
- 2025-04-25 Sprawdzić czy spółka ma sprawy w sądzie
- 2025-04-25 Solarny Palnik Wodorowy
- 2025-04-25 amperomierz w plusie
- 2025-04-25 nie wyłączam silnika
- 2025-04-25 PILNE !! Stara żywność w marketach "Zgodnie z obowiązującym od stycznia 2024 r. prawem przeterminowana, ale nadal zdatna do spożycia żywność, może być sprzedawana przez maksymalnie kolejne 45 dni po dacie na opakowaniu. To legalne tylko wtedy, gdy opakowa