-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!newsfeed.neostrada.pl!unt-exc-01.news.neostrada.pl!unt-spo-a-02.news.n
eostrada.pl!news.neostrada.pl.POSTED!not-for-mail
Content-Type: text/plain; charset=iso-8859-2; format=flowed; delsp=yes
Newsgroups: pl.comp.programming
Subject: Re: Jak efektywnie stwierdzić czy tekst jest w UTF8?
References: <jr8els$en3$1@inews.gazeta.pl> <o...@a...home>
<jrb2gb$25n$1@inews.gazeta.pl>
Date: Thu, 14 Jun 2012 01:09:35 +0200
MIME-Version: 1.0
Content-Transfer-Encoding: Quoted-Printable
From: "Jordan Szubert" <u...@j...us.to>
Organization: HELL inc.
Message-ID: <o...@a...home>
User-Agent: Opera Mail/11.64 (Win32)
Lines: 34
NNTP-Posting-Host: 83.26.221.6
X-Trace: 1339628979 unt-rea-a-02.news.neostrada.pl 1311 83.26.221.6:45380
X-Complaints-To: a...@n...neostrada.pl
Xref: news-archive.icm.edu.pl pl.comp.programming:197891
[ ukryj nagłówki ]Dnia 13-06-2012 o 23:59:42 Borneq <b...@a...hidden.pl> napisał(a):
> Użytkownik "Jordan Szubert" <u...@j...us.to> napisał w wiadomości
> news:op.wfutqgmdhilul8@asus7p.home...
>> jeżeli jest legalnym UTF-8, to przyjmij że jest UTF8, jak dekodowanie
>> UTF-8 daje błędy, to to nie jest UTF-8
>> jak się zaczyna od BOM, to jeszcze bardziej jest
>
> Dobrze działa precyzyjna (nie statystyczna) metoda. Tylko teraz
> sprawdzam cały tekst, w jaki sposób można się ograniczyć np. do 100
> znaków, kiedy zakończenie wypadnie wewnątrz ciągu bajtów oznaczającego
> jeden znak Unicode? Teraz gdy podam długość Len i ciąg się nie zakończy,
> przyjumje że jest koniec pliku i zwraca że to nie jest UTF8.
to chyba będziesz musiał napisać sobie sprawdzarkę, która ma przekazywane
dwie długości: ile ma tekst i jak długi prefix sprawdzać...
--
Jordan Szubert
Następne wpisy z tego wątku
- 14.06.12 11:05 Borneq
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-21 Żerniki => Specjalista ds. Employer Brandingu <=
- 2024-12-21 jak tacy debile
- 2024-12-20 Precedensy politycznie motywowanego nie wydawania w UE
- 2024-12-20 Obrońcy
- 2024-12-20 Obrońcy
- 2024-12-20 Obrońcy
- 2024-12-20 Gdańsk => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-20 czyste powietrze
- 2024-12-20 Katowice => Analyst in the Trade Development department (experience wi
- 2024-12-20 Opole => Inżynier Serwisu Sprzętu Medycznego <=
- 2024-12-20 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-20 Rzeszów => International Freight Forwarder <=
- 2024-12-20 Katowice => Key Account Manager (ERP) <=
- 2024-12-20 Ekstradycja
- 2024-12-20 Mikroskop 3D