-
Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
From: " " <f...@N...gazeta.pl>
Newsgroups: pl.comp.programming
Subject: Re: dalsza optymalizacja
Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
Lines: 118
Message-ID: <jl9fvq$l05$1@inews.gazeta.pl>
References: <jl73ie$b6f$1@inews.gazeta.pl> <jl9aaf$326$1@inews.gazeta.pl>
<jl9al3$ee7$1@inews.gazeta.pl> <jl9dfl$a80$1@inews.gazeta.pl>
NNTP-Posting-Host: localhost
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: inews.gazeta.pl 1333281594 21509 172.20.26.235 (1 Apr 2012 11:59:54 GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Sun, 1 Apr 2012 11:59:54 +0000 (UTC)
X-User: fir
X-Forwarded-For: 46.134.44.204
X-Remote-IP: localhost
Xref: news-archive.icm.edu.pl pl.comp.programming:196501
[ ukryj nagłówki ]> > > > ten sposob rysowania rotowanej bitmapy jest fenomenalny
> > > > swoja prostota
> > > >
> > > > for(int j=0; j<sprite_height; j++)
> > > > {
> > > > for(int i=0; i<sprite_width; i++)
> > > > {
> > > > SetPixel( x>>20, y>>20, sprite[j][i] );
> > > >
> > > > x += dxdx; // skosy/ poprawki dla ruchu pixele na fiz ekranie
> > > > y += dydx; // dla ruchu po tekselach x++
> > > > }
> > > >
> > > > x += dxdy; // skosy dla y++
> > > > y += dydy;
> > > > }
> > > >
> > > > tu raczej nie da sie nic poprawic - ale chcialbym jakos moze
> > > > poprawic sama funkcje stawiania pixela
> > > >
> > > > inline void SetPixelInDibInt(int x, int y, unsigned color)
> > > > {
> > > >
> > > > int yc = CLIENT_Y-y;
> > > >
> > > >
> > > > if(!pBits) return;
> > > >
> > > > if(yc<0) return;
> > > > if(yc>=CLIENT_Y) return;
> > > >
> > > > if(x<0) return;
> > > > if(x>=CLIENT_X) return;
> > > >
> > > >
> > > > int adr = (yc*CLIENT_X+x);
> > > >
> > > > ((unsigned*)pBits)[adr] = color;
> > > >
> > > > }
> > > >
> > > > mam tutaj cala mase warunkow, zabezpieczajacych wprost przed
> > > > postawieniem pixela poza pamiecia ekranu - samo filtrowanie
> > > > sprite'ow robie bardzo zgrubne (odrzucam sprity o srodku iles tam
> > > > dalej poza ekranem ) tak ze przez to przechodzi cala masa
> > > > pixeli ze sprite'ow ktore sa tylko czesciowo w ekranie --
> > > >
> > > > jak przerobic kod tej funkcji by bylo szybciej?
> > > >
> > > wychodzi na to ze wlasnie nalezaloby odwrocic proces - o ile
> > > teraz jake po calej tekturze (a duza tekstura w prog2.exe ma 1000x1000
> > > pixeli ) i czestokroc wypadam poza ekran to po obroceniu mozna
> > > iterowac bez problemu po obruconej teksturze tylko w tym kawalku
> > > ktory lezy w ekranie - tak ze to mogloby nawet przyspieszyc
> > >
> > > (choc sa dodatkowe koszty albo zapisywania tych krawedzi dla sylwetki
> > > albo iterowania po wiekszych kwadratach) - tak ze zarazem moze
przyspieszyc
>
> > > jak i moze zwolnic
> > >
> >
> > troche sie zmeczylem ale wieczorem moze sprobuje (z ciekawosci czy
> > przyspieszy) uruchomic prostrsza wersji z odwrotna transformacja
> > (tj bez sylwetek)
>
> Jeśli już tak optymalizujesz, to powiedz mi czy warto zamienić
> obliczenia z typu double na inta? W programie jest macierz kwadratowa.
> Mieści się ona w całości L2. Powiedzmy że do losowych elementów tej
> macierzy dodaję jedynki, coś w rodzaju:
>
> for( dość dużo pętli )
> macierz[ compute_row() * col_size + compute_col() ] ++ ;
>
> Koszt wykonania compute_row i comute_col jest bardzo mały.
> Potem inne obliczenia muszą być przeprowadzane na typie double, ale
> ta inkrementacja może być wykonana na typie int. Warto zadeklarować
> drugą macierz typu int i potem przekopiować do typu double? Czy
> może operacje inc na typie double są równie szybkie?
>
swego czasu opisywalem jak to podmienienie literalnie czterech
instancji floatow na inty przyspieszyla mi program 2 razy
wyzej bylo opisane jak to przerobienie paru (tez cos kolo czterech
floatow na inty przyspieszylo mi program mw 5 razy - ( 8-9 razy
w stosunku do wersji pierwotnej ktora pozniej przyspieszyla ok 30%
i dopiero przepisanie na fixed pointy to przyspieszylo dalsze ok 5
razy)
z tego co sie orientuje to co tak zarzyna kompa to konwersje
z floata na int - nie jest to dla mnie jasne ale niejaki gourley
w tutku o dynamice plynow (kiedys wspominalem i cytowalem) ppisze
ze aby dokonac przyciecia z floata na inta kompilatory c przelaczaja
tryb fbu - i to chyba to jest problemem
tak czy owak to ze przepisanie paru floatow na fixedpointy przyspieszylo
mi kod z miejsca >5 razy daje do myslenia nt tego by jednak sprawdzac
czy na fxintach to nie ruszy przypadkiem z kopyta
tak naprawde moze to byc jednak nie tyle wina floatow tylko wlasnie tej
konwersji z floata na int - u mnie obliczenia koncza sie jako koordynaty
dla setpixela wiec musza byc calkowite wiec pozostawaloby albo przepisywac
na fixedpointy albo nauczyc sie jakiegos innego sposobu konwersji z inta
na float (tam chodzi chyba o to ze domyslnie dla fpu jest zaokraglanie
a c wymusza obcinanie w dol i to powoduje ze w kolko przelacza tryb fpu
- glupota maksymalna, trzeba sie tym wiecej zainteresowac)
jesli jest tak wlasnie to po prostu moze byc tak ze kazda konwersja
z floata na int to totalny zarzynacz wydajnosci i nalezaloby sie
wogole tego pozbyc (moze jest jakas inna metoda konwersji ktora nie
daje takiej katastrofy)
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 01.04.12 14:20 bartekltg
- 01.04.12 14:21 bartekltg
- 01.04.12 15:07 M.M.
- 01.04.12 15:10 M.M.
- 01.04.12 16:05 bartekltg
- 01.04.12 16:39 M.M.
- 01.04.12 16:44 bartekltg
- 01.04.12 18:06 M.M.
- 01.04.12 18:48 bartekltg
- 01.04.12 19:37 M.M.
- 01.04.12 19:51 bartekltg
- 01.04.12 20:12 bartekltg
- 01.04.12 20:50
- 01.04.12 20:53 M.M.
- 01.04.12 21:57 bartekltg
Najnowsze wątki z tej grupy
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
Najnowsze wątki
- 2025-07-14 granice
- 2025-07-14 Awaria VM?
- 2025-07-14 Gdańsk => Programista Kotlin <=
- 2025-07-14 Warszawa => Junior Rekruter <=
- 2025-07-14 Warszawa => Specjalista rekrutacji IT <=
- 2025-07-14 Wkłady do zniczy...
- 2025-07-14 Warszawa => Specjalista ds. Sprzętu Komputerowego <=
- 2025-07-14 Re: PO chroniło i chroni policyjnych bandziorów [zawiasy za katowanie obywatela (Poznań czerwiec 2012)]
- 2025-07-14 Warszawa => International Freight Forwarder <=
- 2025-07-14 Warszawa => Recruiter 360 <=
- 2025-07-14 Re: Rz?Âd ZAKAZUJE magazyn?Â?w energii ?!! Nowe prawo od 14 lipca to SZOK! ??Â
- 2025-07-14 Warszawa => Sales Assistant <=
- 2025-07-13 Fałszywe alerty
- 2025-07-12 dlaczego gadacie z tym debilem
- 2025-07-13 Unia Europejska przygotowuje nowy podatek