-
Data: 2012-03-01 21:34:06
Temat: OpenMP - jest szybciej czy wolniej?
Od: "slawek" <s...@h...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Procedura solve (napisana w Fortranie), według profilera, wykonuje się 2.43
mikrosekundy jako "single thread". Jeżeli jednak uruchomić program jako
wielowątkowy (2 wątki, OpenMP), to profiler pokazuje około 1.21
mikrosekundy. Problem jednak w tym że cały program, co zmierzyłem "ręcznie"
zwykłym stoperem, a także przez CPU_TIME z wnętrza programu, wykonuje się
wtedy nie krócej - ale aż 20 razy dłużej!
Ciekawe: gprof stwierdza, że to co się zaoszczędziło na 2-gim wątku zostało
zjedzone przez _gcc_deregister_frame, ale i tak - według profilera - cały
program liczył się trochę krócej...
Co to jest? Kiepska implementacja OpenMP? Urok systemu MS Windows XP ?
(Komputer z fizycznie 2-ma rdzeniami i tyle właśnie wątków jest z OpenMP.)
A może jest tak, że jak program jest uruchomiony jako jednowątkowy, to idzie
na jednym rdzeniu i nikomu/niczemu nie pozwala sobie przerywać (prawie 100%
obciążenia rdzenia), natomiast dwuwątkowo co chwila blokuje go sam system
(obciążenie obu rdzeni jest jakieś takie połowiczne). I choć CPU-time jest -
jak widzi to profiler - 3.2 sekundy - to wall-time jest niemal
dwuminutowy?!
Ma ktoś pomysł jak to rozruszać?
Flat profile: <<< wersja 1-wątkowa >>>
time seconds seconds calls us/call us/call name
98.78 4.87 4.87 2000001 2.43 2.43 __main_MOD_solve
1.22 4.93 0.06 MAIN__
granularity: each sample hit covers 4 byte(s) for 0.20% of 4.93 seconds
Flat profile: <<< wersja 2-wątkowa >>>
time seconds seconds calls us/call us/call name
71.70 2.23 2.23 2000001 1.11 1.11 __gcc_deregister_frame
21.86 2.91 0.68 MAIN__
6.11 3.10 0.19 2000001 0.09 1.21 __main_MOD_solve
0.32 3.11 0.01 __chkstk_ms
granularity: each sample hit covers 4 byte(s) for 0.32% of 3.11 seconds
Następne wpisy z tego wątku
- 01.03.12 23:47 Roman W
- 02.03.12 00:13 Karol Y
- 02.03.12 00:16 slawek
- 02.03.12 00:24 slawek
- 02.03.12 00:28 Karol Y
- 02.03.12 00:35 Jordan Szubert
- 02.03.12 01:17 Roman W
- 02.03.12 11:53 slawek
- 02.03.12 12:03 slawek
- 02.03.12 12:12 Arkadiusz Dymek
- 02.03.12 12:12 slawek
- 02.03.12 12:16 Edek Pienkowski
- 02.03.12 12:28 slawek
- 02.03.12 12:35 slawek
- 02.03.12 12:46 Edek Pienkowski
Najnowsze wątki z tej grupy
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
Najnowsze wątki
- 2025-07-12 Warszawa => PC Hardware Expert / Specjalista PC <=
- 2025-07-12 Warszawa => Account Manager - Usługi rekrutacyjne <=
- 2025-07-12 Warszawa => Administrator IT <=
- 2025-07-12 Warszawa => IT Administrator <=
- 2025-07-12 Warszawa => Asystent/tka ds. Administracji <=
- 2025-07-12 Warszawa => Specjalista/stka ds. Organizacji <=
- 2025-07-12 Warszawa => MENA New Business Manager <=
- 2025-07-12 Gdynia => Controlling systems Consultant <=
- 2025-07-12 Warszawa => Developer Microsoft Dynamics 365 Finance & Operations (D36
- 2025-07-12 Warszawa => Programista Microsoft Dynamics 365 Finance & Operations (D
- 2025-07-12 Warszawa => Dyrektor IT <=
- 2025-07-12 Warszawa => IT Director <=
- 2025-07-12 Czy wypowiedź Kaczyńskiego o Braunie jest skarżalna? ["działa z OBCEJ inspiracji"]
- 2025-07-11 Rejestrator temperatur - termopara, siec
- 2025-07-11 DPD, przeniesienie numerów z a2mobile i z Orange