-
Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
From: Edek Pienkowski <e...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: OpenMP - jest szybciej czy wolniej?
Date: Sat, 3 Mar 2012 16:29:04 +0000 (UTC)
Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
Lines: 89
Message-ID: <jitgsg$dvn$19@inews.gazeta.pl>
References: <4f4feb4d$0$1271$65785112@news.neostrada.pl>
<jip3ao$9u9$1@node2.news.atman.pl>
<4f501330$0$26703$65785112@news.neostrada.pl>
<jip477$asl$1@node2.news.atman.pl>
<4f50b4a4$0$26698$65785112@news.neostrada.pl>
<jiqdm3$dvn$5@inews.gazeta.pl>
<4f50bea4$0$1268$65785112@news.neostrada.pl>
<jiqfeg$dvn$6@inews.gazeta.pl>
<4f50c486$0$26685$65785112@news.neostrada.pl>
<jiqhqe$dvn$9@inews.gazeta.pl> <jiqi0e$dvn$10@inews.gazeta.pl>
<4f50ddac$0$1279$65785112@news.neostrada.pl>
<jiqqlu$dvn$13@inews.gazeta.pl>
<4f50f4d2$0$26694$65785112@news.neostrada.pl>
<jiqt59$dvn$15@inews.gazeta.pl>
<4f50fa41$0$26701$65785112@news.neostrada.pl>
<jisdma$441$1@inews.gazeta.pl>
<4f51eeb2$0$1213$65785112@news.neostrada.pl>
<jite8a$dvn$17@inews.gazeta.pl>
<4f5242e5$0$1221$65785112@news.neostrada.pl>
NNTP-Posting-Host: 87.204.176.18
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: inews.gazeta.pl 1330792144 14327 87.204.176.18 (3 Mar 2012 16:29:04 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sat, 3 Mar 2012 16:29:04 +0000 (UTC)
X-User: pieniekusenet
User-Agent: Pan/0.135 (Tomorrow I'll Wake Up and Scald Myself with Tea; GIT 30dc37b
master)
Xref: news-archive.icm.edu.pl pl.comp.programming:195952
[ ukryj nagłówki ]Dnia Sat, 03 Mar 2012 17:12:22 +0100, slawek napisal:
> Użytkownik "Edek Pienkowski" <e...@g...com> napisał w
> wiadomości grup dyskusyjnych:jite8a$dvn$1...@i...gazeta.pl...
>> OpenMP pozwala robić przede wszystkim coarse-grained, fine-grained może
>> i też, ale twoje pętla jest "mikro". Zrób zewnętrzną/wewnętrzną.
>
> Nie taka mikro ;)
Chodzi mi o jedną iterację.
>
> Nie da się - ta pętla to jedyny etap na którym coś sensownie (tj.
> bezmyślnie) można zrównoleglić.
>
> Było rzędu 1000
>
> Dałem docelowe N, czyli 10 000, i nagle... surprise, surprise
>
> (a nic innego nie zmieniałem!)
[...]
To jednak udawadnia twoją tezę, że to trochę chimeryczne stworzenie.
Dla mojej ciekawości: zrobiłbyś test N=1000 (zgubiłem się już, które to
N) i zrobił pętlę tak:
for i = 0 ; i += 1000 ; i < n
for private(j) = i; j < 1000 + i && j < n; j++)
(sam bym zrobił, ale chwilowo mi się system instaluje)
>
>> GPU działa inaczej. Taka pętla będzie "memory-bound", za mało liczenia.
>> W przypadku GPU mówi się o przepustowości, i generalnie przepustowość
>> obliczeniowa karty jest rzędu 8-10 x większa niż przepustowość
>
> Nie o to chodzi - po prostu dziwiłem się kiedyś, po co Intel dał GPU do
> CPU zamiast zrobić coś innego. Tłumaczył się wtedy (inż. z Intela), że
> mieli pusto na krzemie, bo obwód wafelka jest ograniczony prądowo przez
> I/O, więc przy malejącej szerokości ścieżki zostały puste placki, więc
> wsadzili tam coś, czyli GPU. Bardziej jednak prawdopodobne, że te GPU
> tam już teraz jest... aby kiedyś używać podobnie jak to robi CUDA.
Ciekawe story, ten ring danych to pewnie dlatego, że jej się LOTR
przyśnił? Pierścienie na wafelku?
Wiem, że iX mają GPU, ale to inne GPU niż Nvidii. Na nowych AMD,
Intelach może też, już GPU daje jakąś pomoc dla CPU w zwykłym kodzie
CPU, przynajmniej tomshardware tak twierdzi. Jak dla mnie to
chwilowo jest skomplikowane, a że "w domu" i "w pracy" mam
starszy sprzęt (pomijając może mainframe) to nie mam z tym do czynienia.
>
>> Ta, schedulera. W przypadku dwóch wątków na dwucorowym procku scheduler
>> nie ma nic do gadania.
>
> Niezupełnie - oddychają Windowsy, piszę newsy, coś się dzieje...
Ok, ruszysz myszką: przerwanie, I/O, kursor, itd. Podejrzewasz,
że jakikolwiek scheduler robi potem msleep(100)?
Jedyne o czym wiem, to Windows preferuje okienka z focusem. Chcesz
mieć szybciej działającą aplikację: zrób puste okienko. Albo zmień
ustwienia wydajności na "aplikacje w tle", serwerowe to się cyhba nazywa.
>
>> OpenMP jest fajny, RTFM. Trolujesz, czy serio narzekasz?
>
> Na serio narzekam. Powinno być tak prosto jak się da. A jest... no
> dobrze, jeszcze tylko dlaczego OpenMP nie chce działać pod GCC 4.7 ?!
> Tzn. coś mu się nie podoba "stara" glibc. Ok. Ale czy ja mam chęć
> walczyć z glibc - na każdym systemie na jaki przypadkiem trafię?! Nie
> mam!
Do pełni szczęścia dodaj -std=c++0x i miłego debugowania, ech.
>
>> Bo spieprzyłeś. Gcc wektoryzuje pętle. Jak masz task z 1 iteracją może
>> mieć problem (też bym liczył na to, że sobie poradzi, ale nie wszystkie
>> optymalizacje zawsze działają). Zresztą:
>
> Przełom jest przy około 50 tysiącach iteracji.
>
> Nagle wszystko robi się płynne, obciążenie CPU leci do 100%, oba wątki
> się dogadują - normalnie cud mniemany.
Na Thrust możesz zerknąć i tak, samo się na GPU przeniesie.
Edek
Następne wpisy z tego wątku
- 03.03.12 21:29
- 03.03.12 21:33 M.M.
- 03.03.12 23:13 slawek
- 04.03.12 05:46 M.M.
- 04.03.12 10:29 Roman W
- 04.03.12 11:13
- 05.03.12 11:02 Roman W
- 05.03.12 15:14 M.M.
- 05.03.12 18:33 slawek
- 05.03.12 18:42 fir kenobi
- 05.03.12 18:48 slawek
- 05.03.12 18:58 slawek
- 06.03.12 02:27 Michoo
- 06.03.12 06:04 Karol Y
- 06.03.12 09:43 slawek
Najnowsze wątki z tej grupy
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
Najnowsze wątki
- 2025-03-19 Kraków => MS Dynamics 365BC/NAV Developer <=
- 2025-03-19 Aresztowany na rok "powinien podziękować za to, że miał możliwość przebywania w zakładzie karnym, bo tam jego stan zdrowia się poprawił"
- 2025-03-19 Chrzanów => Specjalista ds. public relations <=
- 2025-03-19 China-Kraków => Key Account Manager IT <=
- 2025-03-19 Wrocław => Konsultant wdrożeniowy Comarch XL (Logistyka, WMS, Produk
- 2025-03-19 Prezydent Duda śmie szkalować bodnaturę niepokalanie poczętą, dwóch pełnomocników Geralda B. i "standardy Tuskie"
- 2025-03-18 Tesla na złom
- 2025-03-18 Ziobrotura 3.0 będzie w prawie przesłuchać "świadka" Tuska bez adwokata w sprawach Sienkiewicza/Bodnara/...?
- 2025-03-18 Produkty ,,Made in Germany" wciąż na topie - art. na www.dw.com
- 2025-03-18 ulaskawienia
- 2025-03-18 Gdynia => Sales Executive / KAM <=
- 2025-03-18 42 MILIARDY ZŁOTYCH ZYSKU W ROK. DLACZEGO BANKI TYLE ZARABIAJĄ W POLSCE?
- 2025-03-17 Nie matura lecz chęć szczera ...
- 2025-03-17 Pendrive zdycha, czy coś jeszcze innego? Problem z plikami.
- 2025-03-17 Odkurzacz Smapp Dynamic - dawny Zelmer