-
Data: 2012-03-06 12:52:55
Temat: Re: OpenMP - pewnie, że szybciej (aka "zagadka" rozwiązana)
Od: Michoo <m...@v...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 06.03.2012 10:43, slawek wrote:
>
> Użytkownik "Michoo" <m...@v...pl> napisał w wiadomości grup
> dyskusyjnych:jj3soa$jrf$...@m...internetia.pl...
>> ./a.out 1,97s user 0,00s system 389% cpu 0,507 total
>>
>> I mamy wykonanie 40% szybciej na 2 rdzeniach z HT (z narzutem na
>> zrównoleglenie 180%).
>>
>> Magia polega na dwóch zmianach:
>
> Przypadkiem zauważyłeś, że MSVC to Windows - natomiast ty uruchamiasz i
> testujesz pod Linuksem?
>
> Połowa (większa) problemu to narzuty "wewnętrzne" - widać po twoim
> teście jedynie to, że Linuks sprawdza się lepiej (czyli jak trzeba).
>
>> 1. NIE wykonywaniu TEGO SAMEGO kodu wielokrotnie (naprawdę się
>
> do for paralell jest równoważne parze linijek parallel/do for --
> przynajmniej to wyczytałem w opisie OpenMP
Bo tam jest to zapisane.
A czy wyczytałeś przy okazji coś o koszcie synchronizacji? Każdy blok
parallel to 2 punkty synchronizacji.
0x08048576 <+134>: call 0x8048474 <GOMP_parallel_start@plt>
0x0804857b <+139>: mov DWORD PTR [esp],esi
0x0804857e <+142>: call 0x8048750 <main._omp_fn.0>
0x08048583 <+147>: call 0x8048484 <GOMP_parallel_end@plt>
Lepiej je wykonać 200 razy niż 20000 razy. A jeszcze lepiej wykonać je
tylko raz.
Btw: na podstawie tu przedstawionych wniosków, stosując 2 drobne
modyfikacje w kodzie slawka uzyskałem czas:
$ time ./a.out
CPU time = 1.040000
just for fun 91.999668
./a.out 1,00s user 0,04s system 393% cpu 0,264 total
>
>> 2. sensowny przydział bloków obliczeń
>
> Sensowny dla MS Windows oznacza w tym przypadku kawałki liczące się
> około milisekund. A w programie są mikrosekundowe.
Zazwyczaj im mniej synchronizacji tym szybciej kod działa - to chyba
oczywiste. Przydaje się też, żeby nie właziły sobie nawzajem w cache.
--
Pozdrawiam
Michoo
Następne wpisy z tego wątku
- 06.03.12 17:43 slawek
- 06.03.12 18:08
- 06.03.12 18:10
- 06.03.12 20:50 Roman W
- 07.03.12 15:19 slawek
- 08.03.12 17:58 Karol Y
- 10.03.12 11:25 slawek
- 11.03.12 07:54 Karol Y
- 12.03.12 17:44
- 13.03.12 07:36
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-11-24 Aby WKOOOORWIĆ ekofaszystów ;-)
- 2024-11-22 OC - podwyżka
- 2024-11-22 wyszedł z domu bez buta
- 2024-11-22 Bieda hud.
- 2024-11-24 DS1813-10 się psuje
- 2024-11-23 Białystok => Inżynier bezpieczeństwa aplikacji <=
- 2024-11-23 Szczecin => QA Engineer <=
- 2024-11-23 Warszawa => SEO Specialist (15-20h tygodniowo) <=
- 2024-11-22 Warszawa => Kierownik Działu Spedycji Międzynarodowej <=
- 2024-11-22 Warszawa => Senior Account Manager <=
- 2024-11-22 Warszawa => Key Account Manager <=
- 2024-11-22 Warszawa => DevOps Specialist <=
- 2024-11-22 Kraków => IT Expert (Network Systems area) <=
- 2024-11-22 Warszawa => Infrastructure Automation Engineer <=
- 2024-11-22 Warszawa => Presales / Inżynier Wsparcia Technicznego IT <=