-
Data: 2012-03-06 12:52:55
Temat: Re: OpenMP - pewnie, że szybciej (aka "zagadka" rozwiązana)
Od: Michoo <m...@v...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 06.03.2012 10:43, slawek wrote:
>
> Użytkownik "Michoo" <m...@v...pl> napisał w wiadomości grup
> dyskusyjnych:jj3soa$jrf$...@m...internetia.pl...
>> ./a.out 1,97s user 0,00s system 389% cpu 0,507 total
>>
>> I mamy wykonanie 40% szybciej na 2 rdzeniach z HT (z narzutem na
>> zrównoleglenie 180%).
>>
>> Magia polega na dwóch zmianach:
>
> Przypadkiem zauważyłeś, że MSVC to Windows - natomiast ty uruchamiasz i
> testujesz pod Linuksem?
>
> Połowa (większa) problemu to narzuty "wewnętrzne" - widać po twoim
> teście jedynie to, że Linuks sprawdza się lepiej (czyli jak trzeba).
>
>> 1. NIE wykonywaniu TEGO SAMEGO kodu wielokrotnie (naprawdę się
>
> do for paralell jest równoważne parze linijek parallel/do for --
> przynajmniej to wyczytałem w opisie OpenMP
Bo tam jest to zapisane.
A czy wyczytałeś przy okazji coś o koszcie synchronizacji? Każdy blok
parallel to 2 punkty synchronizacji.
0x08048576 <+134>: call 0x8048474 <GOMP_parallel_start@plt>
0x0804857b <+139>: mov DWORD PTR [esp],esi
0x0804857e <+142>: call 0x8048750 <main._omp_fn.0>
0x08048583 <+147>: call 0x8048484 <GOMP_parallel_end@plt>
Lepiej je wykonać 200 razy niż 20000 razy. A jeszcze lepiej wykonać je
tylko raz.
Btw: na podstawie tu przedstawionych wniosków, stosując 2 drobne
modyfikacje w kodzie slawka uzyskałem czas:
$ time ./a.out
CPU time = 1.040000
just for fun 91.999668
./a.out 1,00s user 0,04s system 393% cpu 0,264 total
>
>> 2. sensowny przydział bloków obliczeń
>
> Sensowny dla MS Windows oznacza w tym przypadku kawałki liczące się
> około milisekund. A w programie są mikrosekundowe.
Zazwyczaj im mniej synchronizacji tym szybciej kod działa - to chyba
oczywiste. Przydaje się też, żeby nie właziły sobie nawzajem w cache.
--
Pozdrawiam
Michoo
Następne wpisy z tego wątku
- 06.03.12 17:43 slawek
- 06.03.12 18:08
- 06.03.12 18:10
- 06.03.12 20:50 Roman W
- 07.03.12 15:19 slawek
- 08.03.12 17:58 Karol Y
- 10.03.12 11:25 slawek
- 11.03.12 07:54 Karol Y
- 12.03.12 17:44
- 13.03.12 07:36
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-15 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-01-15 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-01-15 Białystok => Inżynier Serwisu Sprzętu Medycznego <=
- 2025-01-15 Warszawa => Programista .NET (C#/.NET) <=
- 2025-01-15 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36
- 2025-01-15 Warszawa => Account Manager - Usługi rekrutacyjne <=
- 2025-01-15 serce boli
- 2025-01-14 Seicento vs Szydło, comes back :)
- 2025-01-14 CFM (airflow) AMD Wraitha
- 2025-01-14 16. Raport Totaliztyczny: Sprzedawanie zaszyfrowanych filmów na płytach Blu-Ray bez kluczy deszyfrujących
- 2025-01-13 15. Raport Totaliztyczny: Średniowiecze Po,Zniszczeniu AmigaOS i Plan9
- 2025-01-14 Warszawa => Expert Recruiter 360 <=
- 2025-01-14 Warszawa => Starszy Konsultant AWS <=
- 2025-01-14 Warszawa => Specjalista ds. bezpieczeństwa informacji i ciągłości
- 2025-01-14 Katowice => Key Account Manager (ERP) <=