Re: odchylenie standardowe online - Grupy dyskusyjne w eGospodarka.pl

eGospodarka.pl › Grupy › pl.comp.programming › odchylenie standardowe online › Re: odchylenie standardowe online

Data: 2012-02-09 13:00:41
Temat: Re: odchylenie standardowe online
Od: "slawek" <h...@s...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Użytkownik "Roman W" napisał w wiadomości grup
dyskusyjnych:30851878.2737.1328362702866.JavaMail.ge
o-discussion-forums@yqbc11...

>Regresja liniowa nie wymaga, zeby dane ukladaly sie w wykres funkcji
>jednowartosciowej. Regresja liniowa modeluje problem jako model
>deterministyczny + czynniki losowe. Obecnosc w >zbiorze danych par (X,Y1),
>(X,Y2) itd. oznacza, ze masz kilka realizacji czynnika losowego dla tej
>samej wartosci X. To jest OK.

Mylisz "wykres funkcji" z "funkcją" (to nie jest to samo), piszesz "czynnik
losowy" (choć prawidłowe określenie to "zmienna losowa"), zakładasz iż x to
zmienna niezależna (a przecież nie musi tak być i w praktyce najczęściej nie
jest).

>W podanym przez Ciebie przykladzie problem nie polega na tym, ze dla
>jednego X masz wiele Y, tylko ze masz tylko jeden X. Jezeli wprowadzisz
>zbior danych:

Podany przykład jest tzw. "z życia wziętym". Mamy dane, te dane są "skądś" -
np. z bolometru nadprzewodzącego, ankiety na temat jakości sera, tachometru,
rachunków bankowych. Nie ma gwarancji, że x jest znane dokładnie, nie ma
gwarancji że x lub y się nie będą powtarzać. Nie ma gwarancji, a priori, że
nie będzie serii (0, 1), (0, 2), (0, 3), a nie jest to w żaden sposób gorsza
seria niż (1, 0), (2, 0), (3, 0) - wystarczy tylko np. zamiast spisywać
napięcie i natężenie - spisywać natężenie i napięcie (czyli zrobić taki
swap).

Dobry algorytm poradzi sobie - da jakieś oszacowanie na współczynnik
kierunkowy i wyraz wolny, da jakiś współczynnik korelacji, odchylenia
standardowe... choćby miały one być po prostu nawet i nieskończone (INF jest
w standardzie IEEE). Zły algorytm - wyłoży się, da złą odpowiedź do niczego
nie pasującą (np. dla serii (0, 1), (0, 2), ... będzie to współczynnik
kierunkowy 0.23423), w najlepszym przypadku zgłosi błąd "niedasie".

>Natomiast taki zbior danych
>{ (0,1), (0,1.2), (1,2) }
>jest poprawny.

Po pierwsze, nie ma danych "poprawnych" i "niepoprawnych" - są tylko
prawdziwe i sfałszowane. Elementarna etyka badań naukowych wymaga
przyjmowanie i analizę wszystkich wyników, selektywne "uznaniowe"
traktowanie jest to tzw. "wishfull thinking" i jest bardzo nieprofesjonalne.
Dlatego musisz być gotowy na zupełnie cudaczne ciągi liczb.

Po drugie, pisałem już o EOV, ale wydaje się, że zlekceważyłeś to i nie
odrobiłeś "zadania domowego" - nie wiesz nadal co to EOV. Wikipedii masz
np.: http://en.wikipedia.org/wiki/Errors-in-variables_mod
els . Vic w tym,
że problem "regresji liniowej" robi się natychmiast nieliniowy... prosty (i
nie całkiem poprawny) algorytm znajdziesz np. u Teukolskiego et al. w
Numerical Recipes.