eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingodchylenie standardowe onlineRe: odchylenie standardowe online
  • Data: 2012-02-09 13:00:41
    Temat: Re: odchylenie standardowe online
    Od: "slawek" <h...@s...pl> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    Użytkownik "Roman W" napisał w wiadomości grup
    dyskusyjnych:30851878.2737.1328362702866.JavaMail.ge
    o-discussion-forums@yqbc11...

    >Regresja liniowa nie wymaga, zeby dane ukladaly sie w wykres funkcji
    >jednowartosciowej. Regresja liniowa modeluje problem jako model
    >deterministyczny + czynniki losowe. Obecnosc w >zbiorze danych par (X,Y1),
    >(X,Y2) itd. oznacza, ze masz kilka realizacji czynnika losowego dla tej
    >samej wartosci X. To jest OK.

    Mylisz "wykres funkcji" z "funkcją" (to nie jest to samo), piszesz "czynnik
    losowy" (choć prawidłowe określenie to "zmienna losowa"), zakładasz iż x to
    zmienna niezależna (a przecież nie musi tak być i w praktyce najczęściej nie
    jest).

    >W podanym przez Ciebie przykladzie problem nie polega na tym, ze dla
    >jednego X masz wiele Y, tylko ze masz tylko jeden X. Jezeli wprowadzisz
    >zbior danych:

    Podany przykład jest tzw. "z życia wziętym". Mamy dane, te dane są "skądś" -
    np. z bolometru nadprzewodzącego, ankiety na temat jakości sera, tachometru,
    rachunków bankowych. Nie ma gwarancji, że x jest znane dokładnie, nie ma
    gwarancji że x lub y się nie będą powtarzać. Nie ma gwarancji, a priori, że
    nie będzie serii (0, 1), (0, 2), (0, 3), a nie jest to w żaden sposób gorsza
    seria niż (1, 0), (2, 0), (3, 0) - wystarczy tylko np. zamiast spisywać
    napięcie i natężenie - spisywać natężenie i napięcie (czyli zrobić taki
    swap).

    Dobry algorytm poradzi sobie - da jakieś oszacowanie na współczynnik
    kierunkowy i wyraz wolny, da jakiś współczynnik korelacji, odchylenia
    standardowe... choćby miały one być po prostu nawet i nieskończone (INF jest
    w standardzie IEEE). Zły algorytm - wyłoży się, da złą odpowiedź do niczego
    nie pasującą (np. dla serii (0, 1), (0, 2), ... będzie to współczynnik
    kierunkowy 0.23423), w najlepszym przypadku zgłosi błąd "niedasie".

    >Natomiast taki zbior danych
    >{ (0,1), (0,1.2), (1,2) }
    >jest poprawny.

    Po pierwsze, nie ma danych "poprawnych" i "niepoprawnych" - są tylko
    prawdziwe i sfałszowane. Elementarna etyka badań naukowych wymaga
    przyjmowanie i analizę wszystkich wyników, selektywne "uznaniowe"
    traktowanie jest to tzw. "wishfull thinking" i jest bardzo nieprofesjonalne.
    Dlatego musisz być gotowy na zupełnie cudaczne ciągi liczb.

    Po drugie, pisałem już o EOV, ale wydaje się, że zlekceważyłeś to i nie
    odrobiłeś "zadania domowego" - nie wiesz nadal co to EOV. Wikipedii masz
    np.: http://en.wikipedia.org/wiki/Errors-in-variables_mod
    els . Vic w tym,
    że problem "regresji liniowej" robi się natychmiast nieliniowy... prosty (i
    nie całkiem poprawny) algorytm znajdziesz np. u Teukolskiego et al. w
    Numerical Recipes.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: