-
X-Received: by 10.140.30.118 with SMTP id c109mr80278qgc.15.1418775638323; Tue, 16
Dec 2014 16:20:38 -0800 (PST)
X-Received: by 10.140.30.118 with SMTP id c109mr80278qgc.15.1418775638323; Tue, 16
Dec 2014 16:20:38 -0800 (PST)
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!news.glorb.com!
h15no12145538igd.0!news-out.google.com!r1ni59qat.1!nntp.google.com!n8no96835qaq
.0!postnews.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Tue, 16 Dec 2014 16:20:38 -0800 (PST)
In-Reply-To: <f...@g...com>
Complaints-To: g...@g...com
Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=164.126.18.14;
posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
NNTP-Posting-Host: 164.126.18.14
References: <lq5a1e$7rk$1@node1.news.atman.pl>
<9...@g...com>
<e...@g...com>
<lqadk9$kg7$1@node1.news.atman.pl>
<s...@4...com>
<6...@g...com>
<lqalcn$65n$1@node2.news.atman.pl>
<3...@g...com>
<4...@g...com>
<f...@g...com>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <b...@g...com>
Subject: Re: Szukam benchmarków
From: firr <p...@g...com>
Injection-Date: Wed, 17 Dec 2014 00:20:38 +0000
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
Xref: news-archive.icm.edu.pl pl.comp.programming:207199
[ ukryj nagłówki ]W dniu środa, 17 grudnia 2014 01:05:20 UTC+1 użytkownik firr napisał:
> W dniu wtorek, 16 grudnia 2014 23:53:06 UTC+1 użytkownik M.M. napisał:
> > On Friday, July 18, 2014 10:34:42 AM UTC+2, Wojciech Muła wrote:
> > > Wstawki asemblerowe robi się dla celów wydajnościowych,
> > > kompilatory nie zawsze dają radę.
> > > A już kompletnie nie
> > > dają sobie rady w nietrywialnych przypadkach.
> > Temat wraca. Nie wiem co to są nietrywialne przypadki.
> > Moim zdaniem kompilatory rzadko generują optymalny kod,
> > ale często nie stanowi to problemu. W niektórych wersjach
> > kompilatorów miałem wrażenie, że mała wstawka w asemblerze
> > pogarszała wydajność.
> >
> ostatnio mialem drastyczny przyklad na to ze to co powtarzaja niektorzy ze
kompilator zoptymalizuje sam albo ze generuje dobry kod to sa kompletne bajki
> 9byc moze generuje dobry kod ale z dobrego ciezko zoptymalizowanego zrodla)
>
> konkretny przypadek z tym kodem gdzie chailem wyswietlic teksturowaną kopułe
> w trojwymiarowym prototypie (co obejmuje wyznaczenie wektora kierunku w 3d dla
kazdegio piksela ekranu i zrobieni look up w teksturze na podstawie kierunku)
>
> inicjalna wersja trwala jakies 100 czy nawet 150 ms ms a to glownie dziki temu ze
czas zarly dwa sinusy i pierwiastek na piksel jeszcze z jakims dzieleniem i
rzutowaniami (jak uzyjesz sinusa w kodzie to program jest wydajnosciowym trupem tak
bardzo sinus jest wolny) po stablicowaniu sinusów i normalizacji i jeszcze ze dwu
dniach glowienia sie nad petla czas spadl do 20 i w koncu do 13 milisekund 9prawie 10
razy szybciej niz normalny kod dla gcc) ciegle uwazalem ze to za duzo i zaczalem
przepisywac kod na kafelki gdzie mogelem zrobic na kafelkach pewna interpolacje i
pewne tam drobne rozroznienia, to bylo troche trudne ale spowodowalo ze cza sspadl do
6-10 ms, 910-20 razy sszybciej "niz gcc", jeszcze kombinowalem z rugowaniem castow i
rozwijaniem petli na kafelku i co sie okazalo - zanotowalem zjazd do wlaciwie 2-5 ms
(te 5 ms moglbym jeszcze obnizyc ale to znowu wiaze sie z kolejnymi przepisakami
ktore mi sie nie chcialo robic - wlasciwie to normalny czas tego co mocniej
przyoptymalizowalem spadł do 2 ms (co juz jest mega imponujacym wynikiem) - 50 razy
szybciej wzgledem podejscia ze nie ma co optymalizowac bo nic nie pomoze ;-0
jeszcze mam w odwodzie wersje z intrisinkami na sse (acz watpie by pomogla
zauwazalnie pomogla ) podejrzewam ze carmack czy tam abrash jeszcze
przyoptymalizowaliby to moja wersje z 5 razy (5 to mzoe przesada ale cos w tym stylu)
prawda jest jednak ze optymalizowanie zzera czas, dwa tygodnie w plecy na samio
optymalizowanie tej petli na 10 sposobów
- po czym dwa tygodnie odpoczywania ze wzgledu na przeciazenie - czyli miesiac - na
optymalizacje jednej rzeczy
Następne wpisy z tego wątku
- 17.12.14 03:01 bartekltg
- 17.12.14 09:24 firr
- 17.12.14 09:40 Tomasz Kaczanowski
- 17.12.14 09:47 firr
- 17.12.14 09:51 firr
- 17.12.14 10:11 M.M.
- 17.12.14 10:35 Borneq
- 17.12.14 11:57 bartekltg
- 17.12.14 11:58 bartekltg
- 17.12.14 12:11 firr
- 17.12.14 12:25 firr
- 17.12.14 12:48 bartekltg
- 17.12.14 14:00 M.M.
- 17.12.14 14:24 g...@g...com
- 17.12.14 15:27 M.M.
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-12 Jak na naszych oczach odradza się cenzura :-)
- 2025-01-11 Koszty prowadzenia firmy za granicą
- 2025-01-11 19 migrantów
- 2025-01-11 300km/h
- 2025-01-11 Kongres USA uchwalił "Prawo babci Pawlakowej" na MTK [Lex Gradma Pawlak]
- 2025-01-11 Riga => Specjalista ds. public relations <=
- 2025-01-11 Przestępca wyborczy Musk nadciąga nad Tuskistan?
- 2025-01-11 Białystok => Delphi Programmer <=
- 2025-01-09 Jaka nawigacja z asystentem zmiany pasa ruchu?
- 2025-01-10 Coś dusi.
- 2025-01-09 akumulator napięcie 12.0v
- 2025-01-10 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2025-01-10 Warszawa => Software .Net Developer <=
- 2025-01-10 Białystok => Application Security Engineer <=
- 2025-01-10 Warszawa => System Architect (Java background) <=