-
Data: 2014-12-16 11:28:53
Temat: Re: Dodawanie BOM do pliku w kodowaniu UTF-7 - jak to zrobić?
Od: firr <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu czwartek, 11 grudnia 2014 10:10:07 UTC+1 użytkownik s...@o...pl napisał:
> Witam
> Piszę edytor tekstu i chcę by obsługiwał wszystkie wersje BOM (Byte Order Mark) ze
specyfikacji Unicode. Jednak nie mogę nigdzie znaleść specyfikacji dotyczącej BOM dla
UTF-7. Na unicode.org UTF-7 jest jedynie wzmiankowany w 2 dokumentach pdf i podane są
4 możliwe kombinacje tego BOM. Na wikipedia.org jest nieco więcej i pisze tam, że
przed kodowaniem w base64 do ostatniego bajtu w postaci 001111xx na ostatnich 2
bitach dodaje się pierwsze 2 bity z pierwszego znaku. Problem w tym, że gdy doda się
te 2 bity to nie uzyska się jednej z tych wymienionych 4 wartości czwartego bajtu. A
jeśli się go zakoduje w base64 to wychodzą z tego 2 bajty a nie jeden (jeśli użyję
dla kodowania base64 flagi QByteArray::OmitTrailingEquals co znaczy: Omits adding the
padding equal signs at the end of the encoded data.).
> Dla przykładu:
> mam plik z taką jedną lnią:
> dfassdfas
> To po dodaniu 3bajtów stałych i czwartego zakodowanego w base64 bajtu 001111xx
gdzie xx to 2 bity z pierwszego znaku w tekście. Uzyskuję poniższy tekst:
> +/vPQdfassdfas
> czyli szesnastkowo:
> 2B 2F 76 50 51 64 66 61 73 73 64 66 61 73
> Jak widać zamiast 4 bajtu o dopuszczalnych wartościach 38 39 2B i 2F są 2 bajty 50
51.
>
> Moje pytanie brzmi: Gdzie popełniam błąd?
>
>
popatrzylem na to troche 9w wiki i na jakiejs stronce) ale szczerze mowiac
nie bardzo zrozumialem jak to kodowanie zachodzi -
brany jest bitowy zapis utf-8 i po prostu dzielony na porce 7 bitow? 6 bitow?
czy tez moze ten oryginalny bitowy zapis
(jesli jest cos takiego bo troche sie pogubilem, mam na mysli te wartosci bez tych
znacznikowych bitow sa jakos upychane, jakbym nie patrzyl
cos tu sie nie zgadza ;o
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-01-22 Gdańsk => System Architect (Java background) <=
- 2025-01-22 Katowice => Senior Field Sales (system ERP) <=
- 2025-01-22 Warszawa => Java Developer <=
- 2025-01-22 pokolenie Z
- 2025-01-22 Wyświtlacz ramki cyfrowej
- 2025-01-22 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2025-01-22 Chrzanów => Team Lead / Tribe Lead FrontEnd <=
- 2025-01-22 Ostrów Wielkopolski => Konsultant Wdrożeniowy Comarch XL/Optima (Ksi
- 2025-01-22 oferta na ubezpieczenie OC życie prywatne
- 2025-01-22 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo
- 2025-01-22 Warszawa => International Freight Forwarder <=
- 2025-01-22 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-01-21 Zgromadzenie użytkowników pojazdów :-)
- 2025-01-21 bateria na żądanie
- 2025-01-21 Warszawa => IT Business Analyst <=