Re: OpenMP - pewnie, że szybciej (aka "zagadka" rozwiązana) - Grupy dyskusyjne w eGospodarka.pl

eGospodarka.pl › Grupy › pl.comp.programming › OpenMP - jest szybciej czy wolniej? › Re: OpenMP - pewnie, że szybciej (aka "zagadka" rozwiązana)

Data: 2012-03-06 02:27:10
Temat: Re: OpenMP - pewnie, że szybciej (aka "zagadka" rozwiązana)
Od: Michoo <m...@v...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
On 02.03.2012 20:11, slawek wrote:
[...]
> /***************************************************
****************************************************
************************
>
> !
> ! Program test-omp
> !
> ! /openmp
> !
Zacytuję ioccc:
You can hide a semi truck in 300 lines of C.

Tu jest w 88 liniach C ukryty fiat 126p z 4 przyczepami - nic dziwnego,
że jedzie tak wolno.

Wyniki z mojego komputera (core i5) i gcc-4.6:
(wywaliłem niepotrzebną linijkę z getchar() na końcu)
$ gcc-4.6 -O3 kot.c
$ time ./a.out
CPU time = 8.100000
just for fun 91.999668
./a.out 8,12s user 0,01s system 99% cpu 8,128 total

$ gcc-4.6 -O3 --fast-math kot.c
$ time ./a.out
CPU time = 0.700000
just for fun 91.999668
./a.out 0,71s user 0,00s system 99% cpu 0,716 total

Ciekawi mogą zajrzeć do assemblera i zobaczyć, że gcc zastąpiło
dzielenie i 2 dodawania przez mnożenie i dodawanie. Psuje to pełną
zgodność ze standardem, ale generuje kod 11 razy szybszy.

$ gcc-4.6 -O3 --fast-math -fopenmp kot.c
$ time ./a.out
CPU time = 7.540000
just for fun 91.999668
./a.out 7,18s user 0,39s system 394% cpu 1,917 total

Interesujące - wszystkie rdzenie obciążone, dużo czasu w kernel mode a
czas wykonania ponad 2 razy dłuższy nie mówiąc o czasie procesora, który
jest 10 razy dłuższy.

Pora pobieżnie przejrzeć kod i zaaplikować patch:

- #pragma omp parallel
{

- #pragma omp for schedule(static,100)
for(i = 0; i < n; i++)
v2[i] = v1[i]/(c*c) + epsilon0 + pi;

setup(vec[i1]);
+ #pragma omp parallel for schedule(static,4096)
for(j = 0; j < m; j++)
{

$ gcc-4.6 -O3 --fast-math -fopenmp kod.c
$ time ./a.out
CPU time = 1.960000
just for fun 91.999668
./a.out 1,97s user 0,00s system 389% cpu 0,507 total

I mamy wykonanie 40% szybciej na 2 rdzeniach z HT (z narzutem na
zrównoleglenie 180%).

Magia polega na dwóch zmianach:
1. NIE wykonywaniu TEGO SAMEGO kodu wielokrotnie (naprawdę się
zastanawiam, czy slawek nie umie czytać, czy zrobił to specjalnie(co
będzie pewnie utrzymywać)).
2. sensowny przydział bloków obliczeń

--
Pozdrawiam
Michoo

Następne wpisy z tego wątku

06.03.12 06:04 Karol Y
06.03.12 09:43 slawek
06.03.12 10:00 Roman W
06.03.12 12:52 Michoo
06.03.12 17:43 slawek
06.03.12 18:08
06.03.12 18:10
06.03.12 20:50 Roman W
07.03.12 15:19 slawek
08.03.12 17:58 Karol Y
10.03.12 11:25 slawek
11.03.12 07:54 Karol Y
12.03.12 17:44
13.03.12 07:36

Najnowsze wątki z tej grupy

Najnowsze wątki

2025-05-10 powąchaj instrybutor
2025-05-10 Prawomocny wyrok. Rowerzysta nie ma pierwszeństwa, dojeżdżając do przejazdu
2025-05-09 Propagation velocity v/c dla kabli RF
2025-05-09 Warszawa => Senior Node.js Developer (doświadczenie z framework Nest.
2025-05-09 Patrolowanie kampusów
2025-05-09 Faktyczne opodatkowanie medianowej płacy w Polsce wyniosło 39,4% w lis. 2024r.
2025-05-09 Coca-Cola robi butelki z recyklingu, ale nie etykiety ani zakrętki
2025-05-09 Faktyczne opodatkowanie medianowej płacy w Polsce wyniosło 39,4% w lis. 2024r.
2025-05-09 ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
2025-05-09 Gdańsk => PHP Developer <=
2025-05-09 Warszawa => Programista C <=
2025-05-09 Kiero od deregulacji III Rzeczy (pospolitej) w zaciąga kredyt w 17 bankach by ratować prywatny biznes
2025-05-09 Kiero od deregulacji III Rzeczy (pospolitej) w zaciąga kredyt w 17 bankach by ratować prywatny biznes
2025-05-09 ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
2025-05-09 Gliwice => Business Development Manager - Network and Network Security

Szukaj w grupach

Polecamy

Remarketing - jak skutecznie podążać za klientem

Remarketing - jak skutecznie podążać za klientem

13 najczęstszych błędów przy wysyłaniu mailingu

13 najczęstszych błędów przy wysyłaniu mailingu

Ranking kantorów internetowych. Gdzie najlepsze kursy walut?

Ranking kantorów internetowych. Gdzie najlepsze kursy walut?

Artykuły promowane

Długie weekendy - jak wygląda kalendarz 2025?

Długie weekendy - jak wygląda kalendarz 2025?

Praca zdalna po nowelizacji Kodeksu pracy - korzyści i obowiązki

Dodatkowy urlop opiekuńczy i nowe umowy na okres próbny. Zmiany w Kodeksie pracy uchwalone

Eksperci egospodarka.pl

Najnowsze w serwisie

Elektroniczny system poboru opłat drogowych a nieuzasadnione mandaty – co robić?

Elektroniczny system poboru opłat drogowych a nieuzasadnione mandaty – co robić?

Marzec 2025 to kolejny miesiąc korekty cen materiałów budowlanych

Marzec 2025 to kolejny miesiąc korekty cen materiałów budowlanych

Ceny mieszkań na rynku wtórnym w IV 2025

Ceny mieszkań na rynku wtórnym w IV 2025

USD zyskuje mimo braku realnych postępów

USD zyskuje mimo braku realnych postępów

Rozliczenie składki zdrowotnej do 20 maja

Rozliczenie składki zdrowotnej do 20 maja

Spadły stopy procentowe. Rata za leasing samochodu zaskakuje?

Spadły stopy procentowe. Rata za leasing samochodu zaskakuje?

Cyfrowa rewolucja w płatnościach nie czeka na spóźnionych. Co robią banki?

Cyfrowa rewolucja w płatnościach nie czeka na spóźnionych. Co robią banki?

Kodeksy

Pokaż wszystkie

Pokaż wszystkie

Wzory dokumentów

Na skróty