-
Data: 2012-02-04 10:16:58
Temat: Re: odchylenie standardowe online
Od: "slawek" <s...@h...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Użytkownik "M.M." <m...@g...pl> napisał w wiadomości grup
dyskusyjnych:jgioan$lg3$...@i...gazeta.pl...
> Regresja liniowa to w ogole wdzieczna metoda. Odznacza sie mala
> zlozonoscia i jednoznacznosc wyniku. Mozna miec caly dysk zawalony
> danymi i bez problemu znalezc 2-3tys liniowych parametrow.
Problem nie jest w tym, że można. Problem jest w tym, czy to co się znalazło
ma jakikolwiek sens.
Dla przykładu podaje się zwykle korelację pomiędzy liczbą bocianów a liczbą
urodzeń. Czyli dzieci przynosi bocian. Bingo!
Podstawą jest dobry model (wymaga znajomości danej gałęzi wiedzy). Potem
można dopasowywać, szukać współczynników, stosować metody. Ale wydaje mi
się, że 90% "badaczy" nie ma pojęcia, jak taki model mógłby wyglądać. Stąd
próbują z wynikami "coś zrobić". Wybierają regresję liniową, bo taka opcja
jest w programie którym rysowali dane (często jest to Excel, ambitniejsi
robią to w Matlabie).
Sens urywa się już przy kilkunastu parametrach. Przy 2000 parametrach układ
musiałby mieć liczbę stopni swobody liczoną w milionach, aby uzasadnić że
parametrów ma być właśnie 2000 a nie 1999 . Old-gold Minuit miał hardcoded
150, ale i tak było to na wyrost. Wszystko co ma więcej niż 15 parametrów
wygląda podejrzanie gdy macierz kowariancji jest nietrywialna. Nawet "cały
dysk" (czyli 1TB, czyli 10^12 / 8 fp, czyli około 10 miliardów rekordów,
np. po jednym na każdego człowieka) nie tłumaczy istnienia występujących w
modelu 2000 liniowych parametrów bez kolejnych 200 000 parametrów
nieliniowych.
Następne wpisy z tego wątku
- 04.02.12 12:35 M.M.
- 04.02.12 13:38 Roman W
- 09.02.12 13:00 slawek
- 09.02.12 13:46 bartekltg
- 09.02.12 14:01 bartekltg
- 09.02.12 16:17 Roman W
- 09.02.12 20:51 slawek
- 09.02.12 21:06 slawek
- 09.02.12 21:07 bartekltg
- 09.02.12 21:22 slawek
- 09.02.12 21:27 slawek
- 09.02.12 22:08 bartekltg
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-12 Warszawa => Expert Recruiter 360 <=
- 2025-02-12 Ostrów Wielkopolski => Area Sales Manager OZE <=
- 2025-02-12 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-12 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-12 Kraków => PHP Full Stack Developer <=
- 2025-02-12 Karta dźwiękowa stereo
- 2025-02-12 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-02-12 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-02-12 Łódź => NodeJS Developer <=
- 2025-02-12 Błonie => Sales Specialist <=
- 2025-02-12 Dziwne zachowanie magistrali adresowej w 8085
- 2025-02-11 Mini pecet
- 2025-02-10 Spalił się spaliniak
- 2025-02-10 zarowka wifi - z sensowna apka lub lepiej albo lokalnie lub przez web. I zeby harmonogram miala
- 2025-02-10 Chrzanów => Programista NodeJS <=