-
Data: 2012-03-02 12:03:24
Temat: Re: OpenMP - jest szybciej czy wolniej?
Od: "slawek" <s...@h...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Użytkownik "Jordan Szubert" <u...@j...us.to> napisał w wiadomości grup
dyskusyjnych:o...@a...home...
> myślę, że może być tak, że dwurdzeniowy program poświęca dużo czasu na
> przerzucanie danych między rdzeniami, a jednordzeniowy cały czas ma dane w
> tym rdzeniu, co trzeba (bo jedynym)
Wic w tym, że nie trzeba tych danych przerzucać - bo i po co?
One są przetwarzane _równolegle_ - tj. wektor b jest tworzony z wektora a
tak, że połowę elementów b oblicza wątek 1, a drugą połowę wątek 2.
Oczywiście żaden z wątków nie używa wyników które są otrzymywane poza nim
samym.
W dodatku to był AMD, czyli _wspólne_ cache.
> może być coś innego, Fortrana ni OpenMP nie znam, nie wiem co twój kod
> robić próbuje...
Nie próbuje, tylko robi i to dość skutecznie (jeżeli jest jednowątkowy).
Jeżeli jest uruchomiony z OpenMP też robi to co powinien - tyle że
przeraźliwie wolno (2 minuty zamiast 5 sekund).
A najciekawsze, że profiler daje "dobre" oszacowania - dokładnie takie
jakich spodziewałbym się teoretycznie - tyle, że te oszacowania zupełnie
rozmijają się z tym, co widać na zegarku (takim na rękę, nakręcanym).
Gdzieś jest błąd. I oczywiście jest narzut na tworzenie wątków (200 tysięcy
razy są tworzone), ale: 1. tak to się w OpenMP robi "podręcznikowo"; 2. ten
narzut jest łapany przez profiler jako całkiem nieduży i akceptowalny.
Następne wpisy z tego wątku
- 02.03.12 12:12 Arkadiusz Dymek
- 02.03.12 12:12 slawek
- 02.03.12 12:16 Edek Pienkowski
- 02.03.12 12:28 slawek
- 02.03.12 12:35 slawek
- 02.03.12 12:46 Edek Pienkowski
- 02.03.12 12:52 Edek Pienkowski
- 02.03.12 13:00 slawek
- 02.03.12 13:01 Paweł Kierski
- 02.03.12 13:02 Paweł Kierski
- 02.03.12 13:07 slawek
- 02.03.12 13:12 Edek Pienkowski
- 02.03.12 13:21 slawek
- 02.03.12 13:24 slawek
- 02.03.12 13:25 slawek
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-11-27 Re: UseGalileo -- PRODUKTY I APLIKACJE UŻYWAJĄ JUŻ DZIŚ SYSTEMU GALILEO
- 2024-11-27 Re: UseGalileo -- PRODUKTY I APLIKACJE UŻYWAJĄ JUŻ DZIŚ SYSTEMU GALILEO
- 2024-11-28 droga laweta
- 2024-11-28 Co tam się odpierdala w tej Warszawie?
- 2024-11-28 skąd się biorą tacy debile?
- 2024-11-28 JDG i utylizacja sprzetu
- 2024-11-27 Identyfikacja układ SO8 w sterowniku migających światełek choinkowych
- 2024-11-28 Katowice => Technical Artist <=
- 2024-11-28 Katowice => Technical Artist <=
- 2024-11-28 Bydgoszcz => QA Engineer <=
- 2024-11-28 Zielona Góra => Spedytor międzynarodowy <=
- 2024-11-28 Kraków => DevOps Engineer (Junior or Regular level) <=
- 2024-11-27 Warszawa => Analityk Biznesowo-Systemowy <=
- 2024-11-27 Zielona Góra => Senior PHP Developer <=
- 2024-11-27 Warszawa => Senior Java Developer <=