eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingDodawanie BOM do pliku w kodowaniu UTF-7 - jak to zrobić?Re: Dodawanie BOM do pliku w kodowaniu UTF-7 - jak to zrobić?
  • X-Received: by 10.140.19.108 with SMTP id 99mr1125qgg.34.1418725734056; Tue, 16 Dec
    2014 02:28:54 -0800 (PST)
    X-Received: by 10.140.19.108 with SMTP id 99mr1125qgg.34.1418725734056; Tue, 16 Dec
    2014 02:28:54 -0800 (PST)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!news.glorb.com!
    h15no22791950igd.0!news-out.google.com!r1ni54qat.1!nntp.google.com!s7no7946689q
    ap.1!postnews.google.com!glegroupsg2000goo.googlegroups.com!not-for-mail
    Newsgroups: pl.comp.programming
    Date: Tue, 16 Dec 2014 02:28:53 -0800 (PST)
    In-Reply-To: <7...@g...com>
    Complaints-To: g...@g...com
    Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=46.113.246.251;
    posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
    NNTP-Posting-Host: 46.113.246.251
    References: <7...@g...com>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <b...@g...com>
    Subject: Re: Dodawanie BOM do pliku w kodowaniu UTF-7 - jak to zrobić?
    From: firr <p...@g...com>
    Injection-Date: Tue, 16 Dec 2014 10:28:54 +0000
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:207193
    [ ukryj nagłówki ]

    W dniu czwartek, 11 grudnia 2014 10:10:07 UTC+1 użytkownik s...@o...pl napisał:
    > Witam
    > Piszę edytor tekstu i chcę by obsługiwał wszystkie wersje BOM (Byte Order Mark) ze
    specyfikacji Unicode. Jednak nie mogę nigdzie znaleść specyfikacji dotyczącej BOM dla
    UTF-7. Na unicode.org UTF-7 jest jedynie wzmiankowany w 2 dokumentach pdf i podane są
    4 możliwe kombinacje tego BOM. Na wikipedia.org jest nieco więcej i pisze tam, że
    przed kodowaniem w base64 do ostatniego bajtu w postaci 001111xx na ostatnich 2
    bitach dodaje się pierwsze 2 bity z pierwszego znaku. Problem w tym, że gdy doda się
    te 2 bity to nie uzyska się jednej z tych wymienionych 4 wartości czwartego bajtu. A
    jeśli się go zakoduje w base64 to wychodzą z tego 2 bajty a nie jeden (jeśli użyję
    dla kodowania base64 flagi QByteArray::OmitTrailingEquals co znaczy: Omits adding the
    padding equal signs at the end of the encoded data.).
    > Dla przykładu:
    > mam plik z taką jedną lnią:
    > dfassdfas
    > To po dodaniu 3bajtów stałych i czwartego zakodowanego w base64 bajtu 001111xx
    gdzie xx to 2 bity z pierwszego znaku w tekście. Uzyskuję poniższy tekst:
    > +/vPQdfassdfas
    > czyli szesnastkowo:
    > 2B 2F 76 50 51 64 66 61 73 73 64 66 61 73
    > Jak widać zamiast 4 bajtu o dopuszczalnych wartościach 38 39 2B i 2F są 2 bajty 50
    51.
    >
    > Moje pytanie brzmi: Gdzie popełniam błąd?
    >
    >
    popatrzylem na to troche 9w wiki i na jakiejs stronce) ale szczerze mowiac
    nie bardzo zrozumialem jak to kodowanie zachodzi -
    brany jest bitowy zapis utf-8 i po prostu dzielony na porce 7 bitow? 6 bitow?
    czy tez moze ten oryginalny bitowy zapis
    (jesli jest cos takiego bo troche sie pogubilem, mam na mysli te wartosci bez tych
    znacznikowych bitow sa jakos upychane, jakbym nie patrzyl
    cos tu sie nie zgadza ;o

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: