Re: normalize na fpu - Grupy dyskusyjne w eGospodarka.pl

eGospodarka.pl › Grupy › pl.comp.programming › [asm] normalize na fpu › Re: normalize na fpu

Data: 2012-08-13 15:31:26
Temat: Re: normalize na fpu
Od: bartekltg <b...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
On 12 Sie, 11:48, " kenobi" <f...@g...pl> wrote:

> 90 cykli - i tak szybciej niz to co wyprodukowal moj
> kompiletor (150) [dokladnie nie wiem nawet czemu
> moze przez to ze ta funkcja jest okrojona tj nie
> sprawdza czy nie ma dzielenia przez 0 ;-)

Sprzed której wojny to kompilator?
******
void norm(double &a, double &b, double &c)
{
double dl = sqrt(a*a+b*b+c*c);
a/=dl;
b/=dl;
c/=dl;
}
******
g++ bla.cpp -O2 -S --verbose-asm -g
as -alhnd bla.s > bla.lst
*****
10:bla.cpp **** double dl = sqrt(a*a+b*b+c*c);
61 .loc 1 10 0
62 0004 F20F101F movsd (%rdi), %xmm3 # *a_1(D),
*a_1(D)
63 0008 F20F1016 movsd (%rsi), %xmm2 # *b_5(D),
tmp96
64 000c 660F28C3 movapd %xmm3, %xmm0 # *a_1(D),
tmp82
65 0010 F20F100A movsd (%rdx), %xmm1 # *c_10(D),
tmp94
66 0014 F20F59D2 mulsd %xmm2, %xmm2 # tmp96, tmp96
67 0018 F20F59C3 mulsd %xmm3, %xmm0 # *a_1(D),
tmp82
68 001c F20F59C9 mulsd %xmm1, %xmm1 # tmp94, tmp94
69 0020 F20F58C2 addsd %xmm2, %xmm0 # tmp96, tmp82
70 0024 F20F58C1 addsd %xmm1, %xmm0 # tmp94, tmp82
71 0028 F20F51C8 sqrtsd %xmm0, %xmm1 # tmp82, tmp77
72 002c 660F2EC9 ucomisd %xmm1, %xmm1 # tmp77, tmp77
73 0030 7A25 jp .L6 #,
74 .LVL1:
75 .L2:
11:bla.cpp **** a/=dl;
76 .loc 1 11 0
77 0032 F20F5ED9 divsd %xmm1, %xmm3 # tmp77, tmp88
78 0036 F20F111F movsd %xmm3, (%rdi) # tmp88,
*a_1(D)
12:bla.cpp **** b/=dl;
79 .loc 1 12 0
80 003a F20F1006 movsd (%rsi), %xmm0 # *b_5(D),
tmp90
81 003e F20F5EC1 divsd %xmm1, %xmm0 # tmp77, tmp90
82 0042 F20F1106 movsd %xmm0, (%rsi) # tmp90,
*b_5(D)
13:bla.cpp **** c/=dl;
83 .loc 1 13 0
84 0046 F20F1002 movsd (%rdx), %xmm0 # *c_10(D),
tmp92
85 004a F20F5EC1 divsd %xmm1, %xmm0 # tmp77, tmp92
86 004e F20F1102 movsd %xmm0, (%rdx) # tmp92,
*c_10(D)
87 .LBE2:
14:bla.cpp ****
15:bla.cpp **** }

Na oko wręcz szybciej:)

> chcialbym to poprawic, czy ktos zna jakies zasady
> 'polepszania' takich funkcji ? i moglby zaproponowac
> poprawki?

1. gcc/visual studio.
2. Jakaś wyspecjalizowana biblioteka, jeśli tych obliczeń więcej.

3. Jeśli nie musisz mieć dokładności, to spróbuj to,
http://en.wikipedia.org/wiki/Fast_inverse_square_roo
t#Overview_of_the_code
100 lat temu zastosowanie kilku iteracji Newtona było szybsze niż
sqrt z koprocesora, ale dziś nie musi to być prawdą.

pzdr
bartekltg

Następne wpisy z tego wątku

13.08.12 18:08 kenobi
13.08.12 18:46 bartekltg
13.08.12 19:01 kenobi
13.08.12 19:30 bartekltg
13.08.12 20:07 Michoo
13.08.12 20:24 kenobi
13.08.12 22:21 bartekltg
13.08.12 22:54 kenobi

Najnowsze wątki z tej grupy

Najnowsze wątki

2025-12-29 Greta Thunberg aresztowana w Londynie za wsparcie zdelegalizowanej grupy [Palestine Action - przyp. JMJ]
2025-12-29 Sarkozy
2025-12-29 Czujnik
2025-12-29 Warszawa => Konsultant Microsoft Dynamics AX/365 SCM Consultant - Serv
2025-12-29 Warszawa => IT Recruiter <=
2025-12-29 Warszawa => Solution Architect (Workday) - Legal Systems <=
2025-12-29 Warszawa => Microsoft Dynamics 365 Finance Consultant <=
2025-12-29 Warszawa => Senior Java Developer <=
2025-12-29 Katowice => Key Account Manager <=
2025-12-29 MON nabyło Hutę Częstochowa. "Historyczne znaczenie"
2025-12-28 Czwarta doba strajku na głębokości 500 metrów. "Ministerstwo robi sobie z nas jaja"
2025-12-29 Kolejny kraj [WB - przyp. JMJ] zakazuje chowu klatkowego. W Polsce żyje tak 40 mln kur
2025-12-29 MON nabyło Hutę Częstochowa. "Historyczne znaczenie"
2025-12-28 Norwegia kontra media społecznościowe
2025-12-28 PREZENTY OD MINISTRA FINANSÓW. SKĄD PIENIĄDZE?

Szukaj w grupach

Polecamy

Ranking kantorów internetowych. Gdzie najlepsze kursy walut?

Ranking kantorów internetowych. Gdzie najlepsze kursy walut?

Skuteczna reklama firmy w internecie. Jakie formy reklamy wybrać?

Skuteczna reklama firmy w internecie. Jakie formy reklamy wybrać?

Ranking kont firmowych 2023. W jakim banku najlepsze konto firmowe?

Ranking kont firmowych 2023. W jakim banku najlepsze konto firmowe?

Artykuły promowane

Podatek od wynajmu mieszkania 2023 - jakie stawki i formy opodatkowania?

Podatek od wynajmu mieszkania 2023 - jakie stawki i formy opodatkowania?

Od 2025 r. zmiany m.in. w składkach ZUS, składce zdrowotnej, podatku VAT i podatku od nieruchomości. Co warto wiedzieć już teraz?

Dodatkowy urlop opiekuńczy i nowe umowy na okres próbny. Zmiany w Kodeksie pracy uchwalone

Eksperci egospodarka.pl

Najnowsze w serwisie

Bezpłatny bagaż dziecka w Ryanair - sprawdzamy szczegóły

Bezpłatny bagaż dziecka w Ryanair - sprawdzamy szczegóły

Lokaty i konta oszczędnościowe w grudniu: rekord popularności mimo spadającego oprocentowania

Lokaty i konta oszczędnościowe w grudniu: rekord popularności mimo spadającego oprocentowania

Co czeka firmy od 1 stycznia? Kalendarium najważniejszych dat dla mikro i małych firm na początek 2026 roku

Co czeka firmy od 1 stycznia? Kalendarium najważniejszych dat dla mikro i małych firm na początek 2026 roku

Płaca minimalna 4.806 zł od 2026 r. Jak wzrost wynagrodzeń uderzy w koszty firm

Płaca minimalna 4.806 zł od 2026 r. Jak wzrost wynagrodzeń uderzy w koszty firm

Korekta na srebrze po rekordowych wzrostach

Korekta na srebrze po rekordowych wzrostach

COVID-19 i AI zmieniły branżę IT na zawsze

COVID-19 i AI zmieniły branżę IT na zawsze

Mercedes-Benz E 300 de 4MATIC Kombi: Hybryda plug-in, 313 KM i 90 km na prądzie. Czy to kombi bez wad?

Mercedes-Benz E 300 de 4MATIC Kombi: Hybryda plug-in, 313 KM i 90 km na prądzie. Czy to kombi bez wad?

Kodeksy

Pokaż wszystkie

Pokaż wszystkie

Wzory dokumentów

Na skróty