-
11. Data: 2014-07-22 18:07:36
Temat: Re: szybki logarytm
Od: firr <p...@g...com>
>
> Wymuszenie użycia koprocesora przez -mfpmath=387 nic nie daje,
>
ztcw nalezy uzywac "-mfpmath=both" to daje optymizatorowi do dyspozycji oba sety
rejestrów tym samym pozwala zmniejszyc odwolania do L1
mozesz przy okazji powiedziec moze jakiej opcji uzywasz do disasemblowania kodu?
uzywalem kilku ale te wyniki w disasembly jakos mi sie nie podobają i jeszcze sie
niezdecydowalem co daje 'najlepszą postac'
-
12. Data: 2014-07-22 18:14:10
Temat: Re: szybki logarytm
Od: firr <p...@g...com>
W dniu wtorek, 22 lipca 2014 18:07:36 UTC+2 użytkownik firr napisał:
> >
>
> > Wymuszenie użycia koprocesora przez -mfpmath=387 nic nie daje,
>
> >
>
>
>
> ztcw nalezy uzywac "-mfpmath=both" to daje optymizatorowi do dyspozycji oba sety
rejestrów tym samym pozwala zmniejszyc odwolania do L1
>
tak wiec both wydaje sie najsensowniejsza opcja,
podobno tez autowektoryzer dla sse startuje dopiero przy -O3 tak ze mozna probowac -
ale
na ten autowektoryzer tak po prawdzie to bym za bardzo nie liczył (chyba ze ktos poda
przyklad ze to choc 'czasem' ;/ dziala)
-
13. Data: 2014-07-22 18:39:09
Temat: Re: szybki logarytm
Od: bartekltg <b...@g...com>
On 22.07.2014 18:07, firr wrote:
>>
>> Wymuszenie użycia koprocesora przez -mfpmath=387 nic nie daje,
>>
>
> ztcw nalezy uzywac "-mfpmath=both" to daje optymizatorowi do
Nic nie zmieniło.
> dyspozycji oba sety rejestrów tym samym pozwala zmniejszyc odwolania
> do L1
Wątpię z tym cache. Może w bardzo specyficznym przypadku, gdy akurat
kilka rejestrów więcej ratuje sytuację.
> mozesz przy okazji powiedziec moze jakiej opcji uzywasz do
> disasemblowania kodu? uzywalem kilku ale te wyniki w disasembly jakos
> mi sie nie podobają i jeszcze sie niezdecydowalem co daje 'najlepszą
> postac'
objdump -d
Żeby mieszało z kodem jeszcze -S, wychodzi tak sobie.
Kompilować pewnie trzeba z -g.
pzdr
bartekltg
-
14. Data: 2014-07-22 19:03:20
Temat: Re: szybki logarytm
Od: firr <p...@g...com>
W dniu wtorek, 22 lipca 2014 18:39:09 UTC+2 użytkownik bartekltg napisał:
> On 22.07.2014 18:07, firr wrote:
>
> >>
>
> >> Wymuszenie użycia koprocesora przez -mfpmath=387 nic nie daje,
>
> >>
>
> >
>
> > ztcw nalezy uzywac "-mfpmath=both" to daje optymizatorowi do
>
>
>
> Nic nie zmieniło.
>
>
>
> > dyspozycji oba sety rejestrów tym samym pozwala zmniejszyc odwolania
>
> > do L1
>
>
>
> Wątpię z tym cache. Może w bardzo specyficznym przypadku, gdy akurat
>
> kilka rejestrów więcej ratuje sytuację.
>
>
>
>
>
> > mozesz przy okazji powiedziec moze jakiej opcji uzywasz do
>
> > disasemblowania kodu? uzywalem kilku ale te wyniki w disasembly jakos
>
> > mi sie nie podobają i jeszcze sie niezdecydowalem co daje 'najlepszą
>
> > postac'
>
>
>
> objdump -d
>
>
>
> Żeby mieszało z kodem jeszcze -S, wychodzi tak sobie.
>
> Kompilować pewnie trzeba z -g.
>
no niewazne, ja uzywam -both ;/
a mozesz moze przy okazji sprawdzic czy dla exp() tez generuje cos na sse ze
skokami?
-
15. Data: 2014-07-22 21:25:50
Temat: Re: szybki logarytm
Od: Borneq <b...@a...hidden.pl>
W dniu 2014-07-22 15:58, bartekltg pisze:
> Zerknąłem do tego, co robi oryginalny log. Też głownie
> mnoży i dodaje, ma jednak nieco więcej skoków.
Czy logarytm nie jest liczony przez koprocesor znacznie szybciej?
-
16. Data: 2014-07-22 21:40:32
Temat: Re: szybki logarytm
Od: feldmarszałek tusk <N...@g...pl>
trochę zboczyliśmy z tematu...
pytanie jest takie, jak uzyskać równomierny rozkład punktów na osi x,
gdy skala jest logarytmiczna...
nie wiem czy Ktoś mnie zrozumie, ale może...
-
17. Data: 2014-07-22 21:41:47
Temat: Re: szybki logarytm
Od: feldmarszałek tusk <N...@g...pl>
a jeśli chodzi o prędkość, to musi się wyrabiać w jakichś 20ms...
-
18. Data: 2014-07-22 22:41:13
Temat: Re: szybki logarytm
Od: bartekltg <b...@g...com>
On 22.07.2014 21:25, Borneq wrote:
> W dniu 2014-07-22 15:58, bartekltg pisze:
>> Zerknąłem do tego, co robi oryginalny log. Też głownie
>> mnoży i dodaje, ma jednak nieco więcej skoków.
>
> Czy logarytm nie jest liczony przez koprocesor znacznie szybciej?
Sporo w bibliotece używają sse to chyba nie. Sprawdzenie
nie jest takie łatwe, np mimo -mfpmath=387 w funkcji uzywa
sse. Udało się dopiero dla aplikacji 32 bitowej.
Pętla kręci się nieco, ale wyraźnie wolniej, ale czy to oznacza,
że koprocesor jest dokłądnie o tyle wolniejszy ciężko powiedzieć.
pzdr
bartekltg
-
19. Data: 2014-07-22 22:41:21
Temat: Re: szybki logarytm
Od: bartekltg <b...@g...com>
On 22.07.2014 21:40, feldmarszałek tusk wrote:
> trochę zboczyliśmy z tematu...
>
> pytanie jest takie, jak uzyskać równomierny rozkład punktów na osi x,
> gdy skala jest logarytmiczna...
Ciąg geometryczny.
pzdr
bartekltg
-
20. Data: 2014-07-22 22:54:14
Temat: Re: szybki logarytm
Od: feldmarszałek tusk <N...@g...pl>
8-|