-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!goblin2!goblin.stu.neva.ru!feeder1.cambriumusenet.nl!feed.tweaknews.nl
!209.197.12.246.MISMATCH!nx02.iad01.newshosting.com!newshosting.com!69.16.185.2
1.MISMATCH!npeer03.iad.highwinds-media.com!news.highwinds-media.com!feed-me.hig
hwinds-media.com!postnews.google.com!k21g2000vbn.googlegroups.com!not-for-mail
From: bartekltg <b...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: normalize na fpu
Date: Mon, 13 Aug 2012 06:31:26 -0700 (PDT)
Organization: http://groups.google.com
Lines: 85
Message-ID: <a...@k...googlegroups.com>
References: <k07u5f$930$1@inews.gazeta.pl>
NNTP-Posting-Host: 80.54.0.14
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Trace: posting.google.com 1344864689 924 127.0.0.1 (13 Aug 2012 13:31:29 GMT)
X-Complaints-To: g...@g...com
NNTP-Posting-Date: Mon, 13 Aug 2012 13:31:29 +0000 (UTC)
Complaints-To: g...@g...com
Injection-Info: k21g2000vbn.googlegroups.com; posting-host=80.54.0.14;
posting-account=CvUQzQoAAABvVQmR58QmR6N4Cev1qhAS
User-Agent: G2/1.0
X-HTTP-UserAgent: Mozilla/5.0 (Windows NT 5.1; rv:14.0) Gecko/20100101
Firefox/14.0.1,gzip(gfe)
X-Received-Bytes: 4060
Xref: news-archive.icm.edu.pl pl.comp.programming:199263
[ ukryj nagłówki ]On 12 Sie, 11:48, " kenobi" <f...@g...pl> wrote:
> 90 cykli - i tak szybciej niz to co wyprodukowal moj
> kompiletor (150) [dokladnie nie wiem nawet czemu
> moze przez to ze ta funkcja jest okrojona tj nie
> sprawdza czy nie ma dzielenia przez 0 ;-)
Sprzed której wojny to kompilator?
******
void norm(double &a, double &b, double &c)
{
double dl = sqrt(a*a+b*b+c*c);
a/=dl;
b/=dl;
c/=dl;
}
******
g++ bla.cpp -O2 -S --verbose-asm -g
as -alhnd bla.s > bla.lst
*****
10:bla.cpp **** double dl = sqrt(a*a+b*b+c*c);
61 .loc 1 10 0
62 0004 F20F101F movsd (%rdi), %xmm3 # *a_1(D),
*a_1(D)
63 0008 F20F1016 movsd (%rsi), %xmm2 # *b_5(D),
tmp96
64 000c 660F28C3 movapd %xmm3, %xmm0 # *a_1(D),
tmp82
65 0010 F20F100A movsd (%rdx), %xmm1 # *c_10(D),
tmp94
66 0014 F20F59D2 mulsd %xmm2, %xmm2 # tmp96, tmp96
67 0018 F20F59C3 mulsd %xmm3, %xmm0 # *a_1(D),
tmp82
68 001c F20F59C9 mulsd %xmm1, %xmm1 # tmp94, tmp94
69 0020 F20F58C2 addsd %xmm2, %xmm0 # tmp96, tmp82
70 0024 F20F58C1 addsd %xmm1, %xmm0 # tmp94, tmp82
71 0028 F20F51C8 sqrtsd %xmm0, %xmm1 # tmp82, tmp77
72 002c 660F2EC9 ucomisd %xmm1, %xmm1 # tmp77, tmp77
73 0030 7A25 jp .L6 #,
74 .LVL1:
75 .L2:
11:bla.cpp **** a/=dl;
76 .loc 1 11 0
77 0032 F20F5ED9 divsd %xmm1, %xmm3 # tmp77, tmp88
78 0036 F20F111F movsd %xmm3, (%rdi) # tmp88,
*a_1(D)
12:bla.cpp **** b/=dl;
79 .loc 1 12 0
80 003a F20F1006 movsd (%rsi), %xmm0 # *b_5(D),
tmp90
81 003e F20F5EC1 divsd %xmm1, %xmm0 # tmp77, tmp90
82 0042 F20F1106 movsd %xmm0, (%rsi) # tmp90,
*b_5(D)
13:bla.cpp **** c/=dl;
83 .loc 1 13 0
84 0046 F20F1002 movsd (%rdx), %xmm0 # *c_10(D),
tmp92
85 004a F20F5EC1 divsd %xmm1, %xmm0 # tmp77, tmp92
86 004e F20F1102 movsd %xmm0, (%rdx) # tmp92,
*c_10(D)
87 .LBE2:
14:bla.cpp ****
15:bla.cpp **** }
Na oko wręcz szybciej:)
> chcialbym to poprawic, czy ktos zna jakies zasady
> 'polepszania' takich funkcji ? i moglby zaproponowac
> poprawki?
1. gcc/visual studio.
2. Jakaś wyspecjalizowana biblioteka, jeśli tych obliczeń więcej.
3. Jeśli nie musisz mieć dokładności, to spróbuj to,
http://en.wikipedia.org/wiki/Fast_inverse_square_roo
t#Overview_of_the_code
100 lat temu zastosowanie kilku iteracji Newtona było szybsze niż
sqrt z koprocesora, ale dziś nie musi to być prawdą.
pzdr
bartekltg
Następne wpisy z tego wątku
- 13.08.12 18:08 kenobi
- 13.08.12 18:46 bartekltg
- 13.08.12 19:01 kenobi
- 13.08.12 19:30 bartekltg
- 13.08.12 20:07 Michoo
- 13.08.12 20:24 kenobi
- 13.08.12 22:21 bartekltg
- 13.08.12 22:54 kenobi
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-12 Warszawa => Expert Recruiter 360 <=
- 2025-02-12 Ostrów Wielkopolski => Area Sales Manager OZE <=
- 2025-02-12 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-12 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-12 Kraków => PHP Full Stack Developer <=
- 2025-02-12 Karta dźwiękowa stereo
- 2025-02-12 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-02-12 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-02-12 Łódź => NodeJS Developer <=
- 2025-02-12 Błonie => Sales Specialist <=
- 2025-02-12 Dziwne zachowanie magistrali adresowej w 8085
- 2025-02-11 Mini pecet
- 2025-02-10 Spalił się spaliniak
- 2025-02-10 zarowka wifi - z sensowna apka lub lepiej albo lokalnie lub przez web. I zeby harmonogram miala
- 2025-02-10 Chrzanów => Programista NodeJS <=