-
Path: news-archive.icm.edu.pl!news.rmf.pl!agh.edu.pl!news.agh.edu.pl!news.onet.pl!not
-for-mail
From: "Borneq" <b...@a...hidden.pl>
Newsgroups: pl.comp.programming
Subject: Re: Klasyfikacja bayesowska stron kodowych
Date: Thu, 5 Aug 2010 13:43:33 +0200
Organization: http://onet.pl
Lines: 20
Message-ID: <i3e85p$3nk$1@news.onet.pl>
References: <i317b8$4q1$1@news.onet.pl> <4c54a30f$0$19161$65785112@news.neostrada.pl>
<i3348k$779$1@news.onet.pl> <i33csp$q7p$1@news.onet.pl>
<4c57d3da$0$2605$65785112@news.neostrada.pl> <i3a9mh$rfm$1@news.onet.pl>
<4c595e1a$0$2604$65785112@news.neostrada.pl> <i3ceh7$6dk$1@news.onet.pl>
<4c59ca48$0$19184$65785112@news.neostrada.pl>
NNTP-Posting-Host: 194.117.241.226
Mime-Version: 1.0
Content-Type: text/plain; format=flowed; charset="iso-8859-2"; reply-type=original
Content-Transfer-Encoding: 8bit
X-Trace: news.onet.pl 1281008633 3828 194.117.241.226 (5 Aug 2010 11:43:53 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Thu, 5 Aug 2010 11:43:53 +0000 (UTC)
X-Priority: 3
X-MSMail-Priority: Normal
X-Newsreader: Microsoft Outlook Express 6.00.2900.5931
X-MimeOLE: Produced By Microsoft MimeOLE V6.00.2900.5931
Xref: news-archive.icm.edu.pl pl.comp.programming:186271
[ ukryj nagłówki ]Użytkownik "Segmentation Fault" <c...@o...eu> napisał w
wiadomości news:4c59ca48$0$19184$65785112@news.neostrada.pl...
> Ale dlaczego mnożysz tyle razy ?
> Czy nie wystarczy policzyć histogram, znormalizować i porównać go ze
> wzorcowymi, znormalizowanymi histogramami dla każdego z kodowań?
> I wybrać "najbardziej podobne" kodowanie ?
Patrzyłem na różne funkcje dotyczące histogramów na przykładzie
rozpoznawania spamu. Występują małe różnice w d(H1,H2) i nie zachowują się
jak trzeba (różnica między spamem a niespamem ma być większa niż między nimi
a testowym). Korelacja raczej sprawdza czy wykres punktów (Xi,Yi) leży
bliżej prostej y=x czy y=-x, u mnie to nie występuje. Za to Bayes nadaje się
do tego, mamy wielokrotne mnożenie prawdopodobieństw i kolosalne różnice
między najlepszym histogramem a innymi.
Nie stosuję wzoru
http://en.wikipedia.org/wiki/Bayesian_spam_filtering
#Combining_individual_probabilities
nie wiem czy jest dobry i skąd się wziął a także jest niepotrzebny skoro
możemy po prostu mnożyć prawdopodobieństwa z histogramu przez siebie.
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-31 kupujmy części
- 2025-01-30 pogromca ksiezy
- 2025-01-30 Warszawa => Data Engineer (Tech Lead) <=
- 2025-01-30 Czy WYNIESIENIE UE-posła Brauna z sali obrad UE-parlamentu stanowiło naruszenie jego immunitetu i godności?
- 2025-01-30 drukarka potrzebna
- 2025-01-30 Warszawa => QA Engineer (Quality Assurance) <=
- 2025-01-30 Łódź => Programista NodeJS <=
- 2025-01-30 Jest Trump prezydent jest Meta/FBook/Instagram ugoda za 25 mln. USD
- 2025-01-30 Gdańsk => Solution Architect (Java background) <=
- 2025-01-30 Zielona Góra => Senior Field Sales (system ERP) <=
- 2025-01-30 Błonie => Analityk Systemów Informatycznych (TMS SPEED) <=
- 2025-01-30 DeepSeek nie lubi gadać o polityce
- 2025-01-30 Błonie => Administrator systemów <=
- 2025-01-30 Gliwice => Business Development Manager - Network and Network Security
- 2025-01-30 Warszawa => Programista Full Stack (.Net Core) <=