eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingDetekcja strony kodowej (Bayes?)Re: Detekcja strony kodowej (Bayes?)
  • X-Received: by 2002:a05:620a:13fa:: with SMTP id h26mr8314871qkl.150.1578559544260;
    Thu, 09 Jan 2020 00:45:44 -0800 (PST)
    X-Received: by 2002:a05:620a:13fa:: with SMTP id h26mr8314871qkl.150.1578559544260;
    Thu, 09 Jan 2020 00:45:44 -0800 (PST)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!feeder.erje.net
    !2.eu.feeder.erje.net!proxad.net!feeder1-2.proxad.net!209.85.160.216.MISMATCH!g
    89no2698445qtd.0!news-out.google.com!w29ni380qtc.0!nntp.google.com!g89no2698427
    qtd.0!postnews.google.com!google-groups.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Thu, 9 Jan 2020 00:45:43 -0800 (PST)
    In-Reply-To: <5e070e04$0$17363$65785112@news.neostrada.pl>
    Complaints-To: g...@g...com
    Injection-Info: google-groups.googlegroups.com; posting-host=159.205.34.176;
    posting-account=xjvq9QoAAAATMPC2X3btlHd_LkaJo_rj
    NNTP-Posting-Host: 159.205.34.176
    References: <5e060cd2$0$511$65785112@news.neostrada.pl>
    <20191227152725.50c0c2f8@mateusz>
    <5e06316a$0$17346$65785112@news.neostrada.pl>
    <20191227203426.75e401f5@mateusz>
    <5e070e04$0$17363$65785112@news.neostrada.pl>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <2...@g...com>
    Subject: Re: Detekcja strony kodowej (Bayes?)
    From: "M.M." <m...@g...com>
    Injection-Date: Thu, 09 Jan 2020 08:45:44 +0000
    Content-Type: text/plain; charset="UTF-8"
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:214674
    [ ukryj nagłówki ]

    On Saturday, December 28, 2019 at 9:15:02 AM UTC+1, Borneq wrote:
    > W dniu 2019-12-27 o 20:34, Mateusz Viste pisze:
    > > To może dałoby się załatwić oba problemy jednym podejściem? Wygenerować
    > > sobie dla każdego języka zestaw tablic częstotliwości - po jednej na
    > > każde dopuszczalne kodowanie, i sprawdzać swój plik na tej podstawie -
    > > jeśli szczęście dopisze, to mamy wykrywanie język+strona. Tylko do
    > > tego, jeśli to w ogóle ma statystyczną szansę zadziałać, trzeba mieć
    > > sporą próbkę materiału.
    > >
    > > Mateusz
    > >
    >
    > sprawdze czy zadziala

    Zobacz jeszcze to:
    https://softwareengineering.stackexchange.com/questi
    ons/187169/how-to-detect-the-encoding-of-a-file

    Cytat:
    [
    Files generally indicate their encoding with a file header. There are many examples
    here. However, even reading the header you can never be sure what encoding a file is
    really using.

    For example, a file with the first three bytes 0xEF,0xBB,0xBF is probably a UTF-8
    encoded file. However, it might be an ISO-8859-1 file which happens to start with the
    characters i>>?. Or it might be a different file type entirely.
    ]

    Pozdrawiam

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: