-
11. Data: 2012-02-01 23:54:08
Temat: Re: odchylenie standardowe online
Od: bartekltg <b...@g...com>
W dniu 2012-02-01 17:49, slawek pisze:
>
> Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości grup
> dyskusyjnych:jg57nu$6bg$...@n...news.atman.pl...
>> Przeczytaj do końca, jeden przebieg wystarcza.
>
> Brednie wypisują ci, którzy naiwnie sądzą "jeden przebieg wystarcza".
Brednie wypisujesz.
> Więc osocochodzi? Ano o to, że "wzorek jednoprzebiegowy" jest
> numerycznie niepoprawny, tj. wystarczy podać mu spreparowane dane i
> wtedy zaczyna produkować bzdury.
Jakbyś przeczytał łaskawie całą wypowiedź, znalazłbyś
tam fragment wspominającym o tym problemie i jak
licząc to na zbiorze _liczb całkowitych_ uniknąć tego
problemu.
Ale czytanie boli, więc trzeba samemu napisać.
> Natomiast przy liczeniu od razu sumy kwadratów - błędy zaokrągleń zjedzą
> wam dokładność. Sprawdźcie sami dla jakiej konkretnej wartości a wasz
> algorytm polegnie.
Tak. Pisałem o tym. I pisałem dlaczego M.M. używając
odpowiednie szerokiej liczby może ten problem obejść.
pzdr
bartekltg
-
12. Data: 2012-02-02 18:17:52
Temat: Re: odchylenie standardowe online
Od: "slawek" <s...@h...pl>
Użytkownik "jolz" <B...@i...pl> napisał w wiadomości grup
dyskusyjnych:jgc8hu$ulo$...@u...news.interia.pl...
> Owszem, ale nietrudno wyprowadzic jednoprzebiegowy wzor dajacy poprawny
> numerycznie algorytm. A jeszcze prosciej skopiowac:
> http://en.wikipedia.org/wiki/Algorithms_for_calculat
ing_variance#On-line_algorithm
Tyle, że w/w algorytm daje różne rezultaty: "od początku" vs. "od końca".
-
13. Data: 2012-02-02 18:23:30
Temat: Re: odchylenie standardowe online
Od: "slawek" <s...@h...pl>
Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości grup
dyskusyjnych:jgcjb1$8pk$...@n...news.atman.pl...
> Tak. Pisałem o tym. I pisałem dlaczego M.M. używając
> odpowiednie szerokiej liczby może ten problem obejść.
Problem polega na tym, że a priori nigdy nie wiesz jakie będą kiedyś dane.
Typowym przykładem jest np. regresja liniowa. O, to proste! A potem ktoś
przychodzi i wprowadza sekwencję (0, 1), (0, 2), (0, 3).
-
14. Data: 2012-02-02 22:00:56
Temat: Re: odchylenie standardowe online
Od: " M.M." <m...@g...pl>
slawek <s...@h...pl> napisał(a):
>
> UĹźytkownik "bartekltg" <b...@g...com> napisaĹ w wiadomoĹci grup
> dyskusyjnych:jgcjb1$8pk$...@n...news.atman.pl...
> > Tak. PisaĹem o tym. I pisaĹem dlaczego M.M. uĹźywajÄ c
> > odpowiednie szerokiej liczby moĹźe ten problem obejĹÄ.
>
> Problem polega na tym, Ĺźe a priori nigdy nie wiesz jakie bÄdÄ kiedyĹ dane.
>
> Typowym przykĹadem jest np. regresja liniowa. O, to proste! A potem ktoĹ
> przychodzi i wprowadza sekwencjÄ (0, 1), (0, 2), (0, 3).
Mozna do glownej przekatnej dodac jakies epsilon i powinno dac y = 0x + 2.
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
15. Data: 2012-02-03 09:43:39
Temat: Re: odchylenie standardowe online
Od: bartekltg <b...@g...com>
W dniu 2012-02-02 19:23, slawek pisze:
>
> Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości grup
> dyskusyjnych:jgcjb1$8pk$...@n...news.atman.pl...
>> Tak. Pisałem o tym. I pisałem dlaczego M.M. używając
>> odpowiednie szerokiej liczby może ten problem obejść.
>
> Problem polega na tym, że a priori nigdy nie wiesz jakie będą kiedyś dane.
Często wiem co będziemy liczyć.
Jeśli MM wie, że jego dane są z przedziału [-1000,1000]
to nie wyjdzie poza zakres uint32 dla tablicy długości
<2000. Jeśli wie tylko, że dane to int32 i jest ich
n, to potrzebuje kontenera szerokości 31*2+log_2(n) bitów.
Dodatkowo, jak tu ktoś wspominał, można posiłkować się
oszacowaniami średniej, albo użyć dla poszczególnych
odchyleń średniej z całego przedziału (równoważne
wspominanemu przez Cibie przesunięciu danych - nie
zmienia to wariancji).
Trochę to kosmetyczny zabieg, gdyż jeśli nie chcemy
przechodzić na zmienny przecinek oszacowanie na zakres
liczby będzie takie samo. Za to jeśli przejdziemy, pomoże
(jeśli liczby mają podobna średnią w różnych obszarach)
> Typowym przykładem jest np. regresja liniowa. O, to proste! A potem ktoś
> przychodzi i wprowadza sekwencję (0, 1), (0, 2), (0, 3).
1. Nie ma schematów uniwersalnych.
2. A jaki byś chciał wynik z tych danych? Nie ma rozsądnego wyniku.
Regresja liniowa zakłada istnienie funkcji y=f(x). Tu taka nie istnieje,
co najwyżej odwrotna. Metody numeryczne to nie czarna skrzynka,
trzeba myśleć.
pzdr
bartekltg
-
16. Data: 2012-02-03 09:54:52
Temat: Re: odchylenie standardowe online
Od: " M.M." <m...@g...pl>
bartekltg <b...@g...com> napisał(a):
> > Typowym przykĹadem jest np. regresja liniowa. O, to proste! A potem ktoĹ
> > przychodzi i wprowadza sekwencjÄ (0, 1), (0, 2), (0, 3).
>
> 1. Nie ma schematĂłw uniwersalnych.
> 2. A jaki byĹ chciaĹ wynik z tych danych? Nie ma rozsÄ dnego wyniku.
W niektorych zadaniach zadowalajcym wynikiem dla takich danych
jest f(x) = 2. Trzeba metode jakos uodpornic na takie dane.
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
17. Data: 2012-02-03 10:19:39
Temat: Re: odchylenie standardowe online
Od: bartekltg <b...@g...com>
W dniu 2012-02-03 10:54, M.M. pisze:
> bartekltg<b...@g...com> napisał(a):
>
>>> Typowym przykĹadem jest np. regresja liniowa. O, to proste! A potem ktoĹ
>>> przychodzi i wprowadza sekwencjÄ (0, 1), (0, 2), (0, 3).
>>
>> 1. Nie ma schematĂłw uniwersalnych.
>> 2. A jaki byĹ chciaĹ wynik z tych danych? Nie ma rozsÄ dnego wyniku.
> W niektorych zadaniach zadowalajcym wynikiem dla takich danych
> jest f(x) = 2. Trzeba metode jakos uodpornic na takie dane.
A niby dlaczego. Ostrzeżenie, że macierz jest osobliwa
lub niepewność wyznaczenia współczynnika 'a' ogromna.
Jeśli bedziesz grzebał w metodzie aby ją uodpornić,
bo będzie juz inna metoda (i można się przejechać
w innej stuacji, ale tym razem mniej intuicyjnej!)
pzdr
bartekltg
-
18. Data: 2012-02-03 10:23:46
Temat: Re: odchylenie standardowe online
Od: bartekltg <b...@g...com>
W dniu 2012-02-03 10:54, M.M. pisze:
> bartekltg<b...@g...com> napisał(a):
>
>>> Typowym przykĹadem jest np. regresja liniowa. O, to proste! A potem ktoĹ
>>> przychodzi i wprowadza sekwencjÄ (0, 1), (0, 2), (0, 3).
>>
>> 1. Nie ma schematĂłw uniwersalnych.
>> 2. A jaki byĹ chciaĹ wynik z tych danych? Nie ma rozsÄ dnego wyniku.
> W niektorych zadaniach zadowalajcym wynikiem dla takich danych
> jest f(x) = 2. Trzeba metode jakos uodpornic na takie dane.
Może napisze jaśniej. Taka sytuacja nie jest normalna
dla regresji liniowej. Procedura ja licząca nie powinna
udawać przed użytkownikiem, że wszytko jest ok.
Ten, który wie, o co mu chodzi sam sobie dane zmodyfikuje
czy zastosuje inną metodę. TEn który nie wie, i tak
dostanie najprawdopodobniej nic nie znaczace wyniki
(inne niż były mu potrzebne).
pzdr
bartekltg
-
19. Data: 2012-02-03 17:54:06
Temat: Re: odchylenie standardowe online
Od: "slawek" <s...@h...pl>
Użytkownik " M.M." <m...@g...pl> napisał w wiadomości grup
dyskusyjnych:jgf12n$o31$...@i...gazeta.pl...
> Mozna do glownej przekatnej dodac jakies epsilon i powinno dac y = 0x + 2.
Ale po co? Po co?
Poprawny numerycznie algorytm jest prosty i łatwy w implementacji.
A i jeszcze drobiazg - "dodawanie epsilona" jest czymś, co wymaga ingerencji
operatora elektronicznej maszyny cyfrowej (EMC), czyli cofa nas ździebko...
jakieś 60 lat.
Niby mamy komputer, program, niby liczy się samo - ale trzeba dodawać
"epsilon" itd. - bo inaczej "algorytm się na nas obrazi"...
-
20. Data: 2012-02-03 18:07:47
Temat: Re: odchylenie standardowe online
Od: "slawek" <s...@h...pl>
Użytkownik "bartekltg" <b...@g...com> napisał w wiadomości grup
dyskusyjnych:jgga8c$3ht$...@n...news.atman.pl...
> Regresja liniowa zakłada istnienie funkcji y=f(x). Tu taka nie istnieje,
Regresja liniowa nie zakłada tego. Regresja liniowa jest nt. murzynów
(pigmejów). Serio. Facet, który to wymyślił, był porąbanym rasistą: chciał
udowodnić wyższość wysokich blondynów aryjskich. Przypadkiem odkrył metodę
dopasowywania "najlepszej" prostej do danych doświadczalnych. Nota bene są
jeszcze dwie zupełnie inne metody (Hubera na medianie i jakiś cud wymyślony
parę lat temu przez Holendrów bodajże...), dające zupełnie inne rezultaty.
Algorytm regresji liniowej nie zakłada istnienia zależności funkcyjnej, ale
po prostu określa równanie prostej minimalizującej sumę kwadratów odchyleń
(i to zwykle nie OLS/EOV).
Taka prosta ZAWSZE istnieje... nawet jeżeli jest jeden punkt. Problematyczne
może być zaimplementowanie przy EOV i "pionowej prostej" - ale w oczywisty
niby sposób można tego uniknąć. Nota bene, oryginalny artykuł o EOV był
"zabugowany" - w niecały rok później byłą errata, bo autorzy różniczkowali
nieróżniczkowalne.
> co najwyżej odwrotna. Metody numeryczne to nie czarna skrzynka,
> trzeba myśleć.
Owszem. Radzę też poza myśleniem nieco poczytać - podręczniki na początek,
potem bieżącą literaturę.