-
X-Received: by 2002:a05:620a:13fa:: with SMTP id h26mr8314871qkl.150.1578559544260;
Thu, 09 Jan 2020 00:45:44 -0800 (PST)
X-Received: by 2002:a05:620a:13fa:: with SMTP id h26mr8314871qkl.150.1578559544260;
Thu, 09 Jan 2020 00:45:44 -0800 (PST)
Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!feeder.erje.net
!2.eu.feeder.erje.net!proxad.net!feeder1-2.proxad.net!209.85.160.216.MISMATCH!g
89no2698445qtd.0!news-out.google.com!w29ni380qtc.0!nntp.google.com!g89no2698427
qtd.0!postnews.google.com!google-groups.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Thu, 9 Jan 2020 00:45:43 -0800 (PST)
In-Reply-To: <5e070e04$0$17363$65785112@news.neostrada.pl>
Complaints-To: g...@g...com
Injection-Info: google-groups.googlegroups.com; posting-host=159.205.34.176;
posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
NNTP-Posting-Host: 159.205.34.176
References: <5e060cd2$0$511$65785112@news.neostrada.pl>
<20191227152725.50c0c2f8@mateusz>
<5e06316a$0$17346$65785112@news.neostrada.pl>
<20191227203426.75e401f5@mateusz>
<5e070e04$0$17363$65785112@news.neostrada.pl>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <2...@g...com>
Subject: Re: Detekcja strony kodowej (Bayes?)
From: "M.M." <m...@g...com>
Injection-Date: Thu, 09 Jan 2020 08:45:44 +0000
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
Xref: news-archive.icm.edu.pl pl.comp.programming:214674
[ ukryj nagłówki ]On Saturday, December 28, 2019 at 9:15:02 AM UTC+1, Borneq wrote:
> W dniu 2019-12-27 o 20:34, Mateusz Viste pisze:
> > To może dałoby się załatwić oba problemy jednym podejściem? Wygenerować
> > sobie dla każdego języka zestaw tablic częstotliwości - po jednej na
> > każde dopuszczalne kodowanie, i sprawdzać swój plik na tej podstawie -
> > jeśli szczęście dopisze, to mamy wykrywanie język+strona. Tylko do
> > tego, jeśli to w ogóle ma statystyczną szansę zadziałać, trzeba mieć
> > sporą próbkę materiału.
> >
> > Mateusz
> >
>
> sprawdze czy zadziala
Zobacz jeszcze to:
https://softwareengineering.stackexchange.com/questi
ons/187169/how-to-detect-the-encoding-of-a-file
Cytat:
[
Files generally indicate their encoding with a file header. There are many examples
here. However, even reading the header you can never be sure what encoding a file is
really using.
For example, a file with the first three bytes 0xEF,0xBB,0xBF is probably a UTF-8
encoded file. However, it might be an ISO-8859-1 file which happens to start with the
characters i>>?. Or it might be a different file type entirely.
]
Pozdrawiam
Najnowsze wątki z tej grupy
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
Najnowsze wątki
- 2024-11-08 Warszawa => Head of International Freight Forwarding Department <=
- 2024-11-08 Warszawa => Key Account Manager <=
- 2024-11-08 Szczecin => Key Account Manager (ERP) <=
- 2024-11-08 Białystok => Full Stack web developer (obszar .Net Core, Angular6+) <
- 2024-11-08 Wrocław => Senior PHP Symfony Developer <=
- 2024-11-08 Warszawa => QA Engineer <=
- 2024-11-08 Warszawa => QA Inżynier <=
- 2024-11-08 Warszawa => Key Account Manager <=
- 2024-11-08 Gdańsk => Software .Net Developer <=
- 2024-11-08 Akumulator Hyundai
- 2024-11-08 Warszawa => Manager/Specialist e-commerce (B2C) <=
- 2024-11-08 Gdańsk => Specjalista ds. Sprzedaży <=
- 2024-11-08 Gdańsk => Kierownik Działu Spedycji Międzynarodowej <=
- 2024-11-08 znaj podstawe
- 2024-11-08 Chrzanów => Specjalista ds. public relations <=