-
Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
From: " " <f...@N...gazeta.pl>
Newsgroups: pl.comp.programming
Subject: Re: dalsza optymalizacja
Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
Lines: 118
Message-ID: <jl9fvq$l05$1@inews.gazeta.pl>
References: <jl73ie$b6f$1@inews.gazeta.pl> <jl9aaf$326$1@inews.gazeta.pl>
<jl9al3$ee7$1@inews.gazeta.pl> <jl9dfl$a80$1@inews.gazeta.pl>
NNTP-Posting-Host: localhost
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: inews.gazeta.pl 1333281594 21509 172.20.26.235 (1 Apr 2012 11:59:54 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
X-User: fir
X-Forwarded-For: 46.134.44.204
X-Remote-IP: localhost
Xref: news-archive.icm.edu.pl pl.comp.programming:196501
[ ukryj nagłówki ]> > > > ten sposob rysowania rotowanej bitmapy jest fenomenalny
> > > > swoja prostota
> > > >
> > > > for(int j=0; j<sprite_height; j++)
> > > > {
> > > > for(int i=0; i<sprite_width; i++)
> > > > {
> > > > SetPixel( x>>20, y>>20, sprite[j][i] );
> > > >
> > > > x += dxdx; // skosy/ poprawki dla ruchu pixele na fiz ekranie
> > > > y += dydx; // dla ruchu po tekselach x++
> > > > }
> > > >
> > > > x += dxdy; // skosy dla y++
> > > > y += dydy;
> > > > }
> > > >
> > > > tu raczej nie da sie nic poprawic - ale chcialbym jakos moze
> > > > poprawic sama funkcje stawiania pixela
> > > >
> > > > inline void SetPixelInDibInt(int x, int y, unsigned color)
> > > > {
> > > >
> > > > int yc = CLIENT_Y-y;
> > > >
> > > >
> > > > if(!pBits) return;
> > > >
> > > > if(yc<0) return;
> > > > if(yc>=CLIENT_Y) return;
> > > >
> > > > if(x<0) return;
> > > > if(x>=CLIENT_X) return;
> > > >
> > > >
> > > > int adr = (yc*CLIENT_X+x);
> > > >
> > > > ((unsigned*)pBits)[adr] = color;
> > > >
> > > > }
> > > >
> > > > mam tutaj cala mase warunkow, zabezpieczajacych wprost przed
> > > > postawieniem pixela poza pamiecia ekranu - samo filtrowanie
> > > > sprite'ow robie bardzo zgrubne (odrzucam sprity o srodku iles tam
> > > > dalej poza ekranem ) tak ze przez to przechodzi cala masa
> > > > pixeli ze sprite'ow ktore sa tylko czesciowo w ekranie --
> > > >
> > > > jak przerobic kod tej funkcji by bylo szybciej?
> > > >
> > > wychodzi na to ze wlasnie nalezaloby odwrocic proces - o ile
> > > teraz jake po calej tekturze (a duza tekstura w prog2.exe ma 1000x1000
> > > pixeli ) i czestokroc wypadam poza ekran to po obroceniu mozna
> > > iterowac bez problemu po obruconej teksturze tylko w tym kawalku
> > > ktory lezy w ekranie - tak ze to mogloby nawet przyspieszyc
> > >
> > > (choc sa dodatkowe koszty albo zapisywania tych krawedzi dla sylwetki
> > > albo iterowania po wiekszych kwadratach) - tak ze zarazem moze
przyspieszyc
>
> > > jak i moze zwolnic
> > >
> >
> > troche sie zmeczylem ale wieczorem moze sprobuje (z ciekawosci czy
> > przyspieszy) uruchomic prostrsza wersji z odwrotna transformacja
> > (tj bez sylwetek)
>
> Jeśli już tak optymalizujesz, to powiedz mi czy warto zamienić
> obliczenia z typu double na inta? W programie jest macierz kwadratowa.
> Mieści się ona w całości L2. Powiedzmy że do losowych elementów tej
> macierzy dodaję jedynki, coś w rodzaju:
>
> for( dość dużo pętli )
> macierz[ compute_row() * col_size + compute_col() ] ++ ;
>
> Koszt wykonania compute_row i comute_col jest bardzo mały.
> Potem inne obliczenia muszą być przeprowadzane na typie double, ale
> ta inkrementacja może być wykonana na typie int. Warto zadeklarować
> drugą macierz typu int i potem przekopiować do typu double? Czy
> może operacje inc na typie double są równie szybkie?
>
swego czasu opisywalem jak to podmienienie literalnie czterech
instancji floatow na inty przyspieszyla mi program 2 razy
wyzej bylo opisane jak to przerobienie paru (tez cos kolo czterech
floatow na inty przyspieszylo mi program mw 5 razy - ( 8-9 razy
w stosunku do wersji pierwotnej ktora pozniej przyspieszyla ok 30%
i dopiero przepisanie na fixed pointy to przyspieszylo dalsze ok 5
razy)
z tego co sie orientuje to co tak zarzyna kompa to konwersje
z floata na int - nie jest to dla mnie jasne ale niejaki gourley
w tutku o dynamice plynow (kiedys wspominalem i cytowalem) ppisze
ze aby dokonac przyciecia z floata na inta kompilatory c przelaczaja
tryb fbu - i to chyba to jest problemem
tak czy owak to ze przepisanie paru floatow na fixedpointy przyspieszylo
mi kod z miejsca >5 razy daje do myslenia nt tego by jednak sprawdzac
czy na fxintach to nie ruszy przypadkiem z kopyta
tak naprawde moze to byc jednak nie tyle wina floatow tylko wlasnie tej
konwersji z floata na int - u mnie obliczenia koncza sie jako koordynaty
dla setpixela wiec musza byc calkowite wiec pozostawaloby albo przepisywac
na fixedpointy albo nauczyc sie jakiegos innego sposobu konwersji z inta
na float (tam chodzi chyba o to ze domyslnie dla fpu jest zaokraglanie
a c wymusza obcinanie w dol i to powoduje ze w kolko przelacza tryb fpu
- glupota maksymalna, trzeba sie tym wiecej zainteresowac)
jesli jest tak wlasnie to po prostu moze byc tak ze kazda konwersja
z floata na int to totalny zarzynacz wydajnosci i nalezaloby sie
wogole tego pozbyc (moze jest jakas inna metoda konwersji ktora nie
daje takiej katastrofy)
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 01.04.12 14:20 bartekltg
- 01.04.12 14:21 bartekltg
- 01.04.12 15:07 M.M.
- 01.04.12 15:10 M.M.
- 01.04.12 16:05 bartekltg
- 01.04.12 16:39 M.M.
- 01.04.12 16:44 bartekltg
- 01.04.12 18:06 M.M.
- 01.04.12 18:48 bartekltg
- 01.04.12 19:37 M.M.
- 01.04.12 19:51 bartekltg
- 01.04.12 20:12 bartekltg
- 01.04.12 20:50
- 01.04.12 20:53 M.M.
- 01.04.12 21:57 bartekltg
Najnowsze wątki z tej grupy
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
Najnowsze wątki
- 2024-12-25 Wrocław => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2024-12-25 Warszawa => Sales Assistant <=
- 2024-12-25 Kraków => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-25 Lublin => System Architect (Java background) <=
- 2024-12-25 Szczecin => Specjalista ds. public relations <=
- 2024-12-25 Wrocław => Key Account Manager <=
- 2024-12-25 Kraków => Full Stack .Net Engineer <=
- 2024-12-25 Kraków => Programista Full Stack .Net <=
- 2024-12-25 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-25 Białystok => Inżynier Serwisu Sprzętu Medycznego <=
- 2024-12-25 Białystok => Delphi Programmer <=
- 2024-12-25 Chrzanów => Team Lead / Tribe Lead FrontEnd <=
- 2024-12-25 Kraków => Ekspert IT (obszar systemów sieciowych) <=
- 2024-12-25 Mińsk Mazowiecki => Spedytor Międzynarodowy <=
- 2024-12-24 Dzisiaj Bentlejem czyli przybieżeli sześciu Króli do Rysia na kasie