-
Path: news-archive.icm.edu.pl!news.rmf.pl!agh.edu.pl!news.agh.edu.pl!news.onet.pl!not
-for-mail
From: Paweł Kierski <n...@p...net>
Newsgroups: pl.comp.programming
Subject: Re: Klasyfikacja bayesowska stron kodowych
Date: Sun, 01 Aug 2010 08:29:40 +0200
Organization: http://onet.pl
Lines: 15
Message-ID: <i3348k$779$1@news.onet.pl>
References: <i317b8$4q1$1@news.onet.pl> <4c54a30f$0$19161$65785112@news.neostrada.pl>
NNTP-Posting-Host: 109.243.180.192
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2; format=flowed
Content-Transfer-Encoding: 8bit
X-Trace: news.onet.pl 1280644181 7401 109.243.180.192 (1 Aug 2010 06:29:41 GMT)
X-Complaints-To: n...@o...pl
NNTP-Posting-Date: Sun, 1 Aug 2010 06:29:41 +0000 (UTC)
User-Agent: Mozilla/5.0 (Windows; U; Windows NT 5.1; pl; rv:1.9.2.7) Gecko/20100713
Thunderbird/3.1.1
In-Reply-To: <4c54a30f$0$19161$65785112@news.neostrada.pl>
Xref: news-archive.icm.edu.pl pl.comp.programming:186211
[ ukryj nagłówki ]W dniu 2010-08-01 00:26, Segmentation Fault pisze:
> On 07/31/2010 03:10 PM, Borneq wrote:
>> W jaki sposób można rozpoznawać stronę kodową np. Latin2,
>> Windows1250,UTF8 na podstawie tekstu, czy do tego mogą przydać się
>> algorytmy bayesowskie?
>
> Ja bym zaczął od histogramów; kolejność znaków nie jest ważna przy
> rozpoznawaniu kodowania.
W przypadku języka polskiego obstawiam, że może pomóc. Być może np.
'ó' będzie często poprzedzało 'w'.
--
Paweł Kierski
n...@p...net
Następne wpisy z tego wątku
- 01.08.10 08:56 Borneq
- 01.08.10 09:00 Borneq
- 01.08.10 12:25 Borneq
- 03.08.10 08:31 Segmentation Fault
- 03.08.10 23:45 Borneq
- 04.08.10 12:33 Segmentation Fault
- 04.08.10 19:19 Borneq
- 04.08.10 20:15 Segmentation Fault
- 05.08.10 11:43 Borneq
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-19 Kamerka sam. na tył
- 2024-12-20 Jak być bezpiecznym z Li-Ion?
- 2024-12-19 Fujitsu LIFEBOOK E746
- 2024-12-19 Katowice => Administrator IT - Systemy Operacyjne i Wirtualizacja <=
- 2024-12-19 Warszawa => Junior Account Manager <=
- 2024-12-19 Katowice => Administrator IT - Operating Systems and Virtualization <=
- 2024-12-19 Warszawa => Developer .NET (mid) <=
- 2024-12-19 Wrocław => Business Development Manager - Network and Network Securit
- 2024-12-19 Katowice => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-12-19 Olsztyn => Sales Specialist <=
- 2024-12-19 Żerniki => Specjalista ds. Employer Brandingu <=
- 2024-12-19 policja pomaga
- 2024-12-19 Kolejny biegły
- 2024-12-19 Taka ciekawostka skrzyżowaniowa
- 2024-12-19 koniki obsiadły kolejki i numerki