-
X-Received: by 10.140.27.182 with SMTP id 51mr63939qgx.8.1404235213516; Tue, 01 Jul
2014 10:20:13 -0700 (PDT)
X-Received: by 10.140.27.182 with SMTP id 51mr63939qgx.8.1404235213516; Tue, 01 Jul
2014 10:20:13 -0700 (PDT)
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!news.nask.pl!news.nask.org.pl!newsfeed.pionier.net.pl!news.glorb.com!h
n18no1464009igb.0!news-out.google.com!a8ni1qaq.1!nntp.google.com!w8no4970890qac
.0!postnews.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Tue, 1 Jul 2014 10:20:13 -0700 (PDT)
Complaints-To: g...@g...com
Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=37.209.129.78;
posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
NNTP-Posting-Host: 37.209.129.78
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <a...@g...com>
Subject: sse i skaczace wyniki
From: firr <p...@g...com>
Injection-Date: Tue, 01 Jul 2014 17:20:13 +0000
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
Xref: news-archive.icm.edu.pl pl.comp.programming:206087
[ ukryj nagłówki ]ostatnio sie troche chyba przekodowalem
i nie che mi sie kodowac (trzeba bedzie troche
odpoczac) ale robie jeszcze drobne testy
i np dziwi mnie ze sytuacja jaka mam
w przypadku prob porownywania mnozen
100k 3-floatowych wektorow przez 9-floatowa
tablice 100k x 12 bajtów = 1.2 MB
najdziwniejsze jest to ze wyniki strasznie
skaczą w zaleznosci np od kolejnosci
uruchamiania petli (czy float przy sse czy
sse po float, skacza tez przy zmiani ilosci
petlowania tego - i to skacza na tyle ze
po prostu te wyniki jest mi ciezko jednoznacznie
zinterpretowac - choc to moze dlatego ze
nie wiem czego sie spodziewac i jak to zinterpretowac
jak robilem proby to mam faktycznie 5 rodzajów wynikow
1) sse jest sloadowo szybszy od float
2) nieco szybsze jest to co jest wykonywane drugie
3) znacznie szybsze jest to co jest wykonywane drugie
4) sse jest 10 razy szybszy od float (?)
5) sse jest 5 razy szybszy od float
np dla ostatnich moich wynikow loopowanie 100
razy tego mnozenia 100k zajmuje 182 ms w zwylym mnozeniu przez floaty 44 ms w
mnozeniu przez sse
- sa to niby dosyc racjonalnie wygladajace wyniki
ale jednak wydawaloby sie ze jako ze raczej dominuje czytanie i pisanie do pamieci a
nie mnozenia i dodawania nie powinno to byc az tyle -- (ale to powiedzmy nie jest az
tak dziwne dziwne sa te
skoki - moj timer na ogol sie sprawdzal tj mierzyl
tak jak trzeba fizyczne czasy wiec chyba jest ok,
choc czasem jakis blad tez jest nietrudno zrobic
- tak ze w sumie nie wiem jak to rozumiec - trzeba bedzie tych testow porobic wiecej
-- juz troche nawyklem do intrisicow tak ze nawet pewnie dalbym rade przepisac cale
srodkowe* pipeline mojego rasteryzera
i wtedy najlepiej by bylo obejrzec to na czasach ramki
* bo samej rasteryzacji trojkata raczej sie nie da przepisac na sse bo nie sa to
zgodne operacje te trojkaty sa calkiem inne i gdzie iniedziej itp nie
dadza sie w ten sposob zrobic - jest to nawet chyba dobry przyklad kodu ktory jest w
ciezkim lópie a ktory absolutnie (chyba - a moze gdyby tak 4 scanline robic na raz,
nie wiem) nie da sie odpalic na sse - wiecej testow jak odpoczne
Następne wpisy z tego wątku
- 01.07.14 19:32 firr
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-06-27 Re: Prywatny parking? Pierwsze 10 minut bezplatnie
- 2024-06-27 A co mnie to koooorwa obchodzi?
- 2024-06-28 nawigacja satelitarna
- 2024-06-28 SmartLife/Tuya i osuszanie -- mordowanie z zimną krwią...
- 2024-06-27 położyłem kafelki
- 2024-06-28 Łódź => International Freight Forwarder <=
- 2024-06-28 Łódź => Spedytor Międzynarodowy <=
- 2024-06-28 Gdańsk => Head of International Freight Forwarding Department <=
- 2024-06-28 Sopot => Team Leader E-Commerce for Foreign Markets <=
- 2024-06-28 Warszawa => Senior React Native Developer <=
- 2024-06-28 Warszawa => Frontend Developer (React) <=
- 2024-06-28 Warszawa => Software .Net Developer <=
- 2024-06-28 Warszawa => Frontend Developer (React) <=
- 2024-06-28 Warszawa => Programista Full Stack .Net <=
- 2024-06-28 Warszawa => Frontend Developer (React) <=