Re: dalsza optymalizacja - Grupy dyskusyjne w eGospodarka.pl

eGospodarka.pl › Grupy › pl.comp.programming › dalsza optymalizacja › Re: dalsza optymalizacja

Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
From: " " <f...@N...gazeta.pl>
Newsgroups: pl.comp.programming
Subject: Re: dalsza optymalizacja
Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
Lines: 118
Message-ID: <jl9fvq$l05$1@inews.gazeta.pl>
References: <jl73ie$b6f$1@inews.gazeta.pl> <jl9aaf$326$1@inews.gazeta.pl>
<jl9al3$ee7$1@inews.gazeta.pl> <jl9dfl$a80$1@inews.gazeta.pl>
NNTP-Posting-Host: localhost
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: inews.gazeta.pl 1333281594 21509 172.20.26.235 (1 Apr 2012 11:59:54 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
X-User: fir
X-Forwarded-For: 46.134.44.204
X-Remote-IP: localhost
Xref: news-archive.icm.edu.pl pl.comp.programming:196501
[ ukryj nagłówki ]
> > > > ten sposob rysowania rotowanej bitmapy jest fenomenalny
> > > > swoja prostota
> > > >
> > > > for(int j=0; j<sprite_height; j++)
> > > > {
> > > > for(int i=0; i<sprite_width; i++)
> > > > {
> > > > SetPixel( x>>20, y>>20, sprite[j][i] );
> > > >
> > > > x += dxdx; // skosy/ poprawki dla ruchu pixele na fiz ekranie
> > > > y += dydx; // dla ruchu po tekselach x++
> > > > }
> > > >
> > > > x += dxdy; // skosy dla y++
> > > > y += dydy;
> > > > }
> > > >
> > > > tu raczej nie da sie nic poprawic - ale chcialbym jakos moze
> > > > poprawic sama funkcje stawiania pixela
> > > >
> > > > inline void SetPixelInDibInt(int x, int y, unsigned color)
> > > > {
> > > >
> > > > int yc = CLIENT_Y-y;
> > > >
> > > >
> > > > if(!pBits) return;
> > > >
> > > > if(yc<0) return;
> > > > if(yc>=CLIENT_Y) return;
> > > >
> > > > if(x<0) return;
> > > > if(x>=CLIENT_X) return;
> > > >
> > > >
> > > > int adr = (yc*CLIENT_X+x);
> > > >
> > > > ((unsigned*)pBits)[adr] = color;
> > > >
> > > > }
> > > >
> > > > mam tutaj cala mase warunkow, zabezpieczajacych wprost przed
> > > > postawieniem pixela poza pamiecia ekranu - samo filtrowanie
> > > > sprite'ow robie bardzo zgrubne (odrzucam sprity o srodku iles tam
> > > > dalej poza ekranem ) tak ze przez to przechodzi cala masa
> > > > pixeli ze sprite'ow ktore sa tylko czesciowo w ekranie --
> > > >
> > > > jak przerobic kod tej funkcji by bylo szybciej?
> > > >
> > > wychodzi na to ze wlasnie nalezaloby odwrocic proces - o ile
> > > teraz jake po calej tekturze (a duza tekstura w prog2.exe ma 1000x1000
> > > pixeli ) i czestokroc wypadam poza ekran to po obroceniu mozna
> > > iterowac bez problemu po obruconej teksturze tylko w tym kawalku
> > > ktory lezy w ekranie - tak ze to mogloby nawet przyspieszyc
> > >
> > > (choc sa dodatkowe koszty albo zapisywania tych krawedzi dla sylwetki
> > > albo iterowania po wiekszych kwadratach) - tak ze zarazem moze
przyspieszyc
>
> > > jak i moze zwolnic
> > >
> >
> > troche sie zmeczylem ale wieczorem moze sprobuje (z ciekawosci czy
> > przyspieszy) uruchomic prostrsza wersji z odwrotna transformacja
> > (tj bez sylwetek)
>
> Jeśli już tak optymalizujesz, to powiedz mi czy warto zamienić
> obliczenia z typu double na inta? W programie jest macierz kwadratowa.
> Mieści się ona w całości L2. Powiedzmy że do losowych elementów tej
> macierzy dodaję jedynki, coś w rodzaju:
>
> for( dość dużo pętli )
> macierz[ compute_row() * col_size + compute_col() ] ++ ;
>
> Koszt wykonania compute_row i comute_col jest bardzo mały.
> Potem inne obliczenia muszą być przeprowadzane na typie double, ale
> ta inkrementacja może być wykonana na typie int. Warto zadeklarować
> drugą macierz typu int i potem przekopiować do typu double? Czy
> może operacje inc na typie double są równie szybkie?
>

swego czasu opisywalem jak to podmienienie literalnie czterech
instancji floatow na inty przyspieszyla mi program 2 razy

wyzej bylo opisane jak to przerobienie paru (tez cos kolo czterech
floatow na inty przyspieszylo mi program mw 5 razy - ( 8-9 razy
w stosunku do wersji pierwotnej ktora pozniej przyspieszyla ok 30%
i dopiero przepisanie na fixed pointy to przyspieszylo dalsze ok 5
razy)

z tego co sie orientuje to co tak zarzyna kompa to konwersje
z floata na int - nie jest to dla mnie jasne ale niejaki gourley
w tutku o dynamice plynow (kiedys wspominalem i cytowalem) ppisze
ze aby dokonac przyciecia z floata na inta kompilatory c przelaczaja
tryb fbu - i to chyba to jest problemem

tak czy owak to ze przepisanie paru floatow na fixedpointy przyspieszylo
mi kod z miejsca >5 razy daje do myslenia nt tego by jednak sprawdzac
czy na fxintach to nie ruszy przypadkiem z kopyta

tak naprawde moze to byc jednak nie tyle wina floatow tylko wlasnie tej
konwersji z floata na int - u mnie obliczenia koncza sie jako koordynaty
dla setpixela wiec musza byc calkowite wiec pozostawaloby albo przepisywac
na fixedpointy albo nauczyc sie jakiegos innego sposobu konwersji z inta
na float (tam chodzi chyba o to ze domyslnie dla fpu jest zaokraglanie
a c wymusza obcinanie w dol i to powoduje ze w kolko przelacza tryb fpu
- glupota maksymalna, trzeba sie tym wiecej zainteresowac)

jesli jest tak wlasnie to po prostu moze byc tak ze kazda konwersja
z floata na int to totalny zarzynacz wydajnosci i nalezaloby sie
wogole tego pozbyc (moze jest jakas inna metoda konwersji ktora nie
daje takiej katastrofy)

--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/