-
21. Data: 2016-10-10 19:13:19
Temat: Re: Thunderbird - kodowanie
Od: Piotr Gałka <p...@c...pl>
W dniu 10-10-2016 o 19:07, Grzegorz Niemirowski pisze:
>> Na ile to ogarniam to odpowiadałeś nie na ISO jak myślałeś a na UTF-8.
>> Sądzę tak, bo jak zobaczę źródło tamtej wiadomości to gdzieś na
>> początku From: widzę UTF-8.
>
> Przyjrzyj się dokładnie, co to jest to "gdzieś" :)
Czyli nie ogarniam.
Jakby to ISO było dużymi literami to może bym zauważył :).
P.G.
-
22. Data: 2016-10-10 19:14:14
Temat: Re: Thunderbird - kodowanie
Od: Michał Czarkowski <m...@p...onet.pl>
W dniu 10.10.2016 o 18:58, Piotr Gałka pisze:
> Nie wiem też, co znaczy ustawienie TB o pisaniu w HTML.
> P.G.
TB jak thunderbird :-D
-
23. Data: 2016-10-10 19:14:40
Temat: Re: Thunderbird - kodowanie
Od: "re" <r...@r...invalid>
Użytkownik "Michał Czarkowski"
...
My tu o iso-8859-2, utf-8, a problem wydaje się być szerszy:
http://blog.fuertigo.pl/Porady/ISO-8859-2-vs-UTF-8-S
tandardy-kodowania-nowoczesnych-witryn/59/
jeden z komentarzy:
,,Lukasz032 o rok temu
Problem polega na tym, że póki co nikt nie odwołał Polskiej Normy
PN-T-42118:1993 - a więc przynajmniej w aplikacjach z przetargu czy
innych dla kontrahentów wymagających przestrzegania Polskich Norm nie ma
innego wyjścia niż latin2. ...
---
Nie odwołał też US-ASCII i co z tego ?
Kodowania ISO-8859-2 nie należy używać bo NIE nadaje się do kodowania języka
polskiego. Nie ma w nim polskich znaków cudzysłowu. Właściwsze byłoby
Windows-1250, ale oczywiście nie ma specjalnie potrzeby używania
jakichkolwiek kodowań stronicowanych skoro jest jednolity Unikod.
"
UTF-8
...
Wady
...
Rozmiar - każdy znak łaciński w tym kodowaniu zajmuje dwa, zamiast jednego
bajta
"
Nonsens. Znaki łacińskie są właśnie kodowane jednobajtowo a wykraczające
poza łacińskie wielobajtowo (dwu lub WIĘCEJ-bajtowo). Bo UTF-8 to jest jeden
ze sposobów kodowania Unikodu zorientowany na kompatybilność z US-ASCII
czyli w praktyce właśnie tą łaciną.
Dalej
"
Problemy z BOM - niektóre aplikacje (jak np. notatnik systemu Windows)
umożliwia zapisywanie plików jedynie za pomocą UTF-8 z BOM.
"
BOM nie jest problemem tylko zaletą. Dzięki niemu aplikacje unikodowe w tym
ten Notatnik potrafią zauważyć, że plik został zakodowany w Unikodzie. I
rozpoznawane są różne kodowania Unikodu a nie tylko Utf-8.
-
24. Data: 2016-10-10 19:15:39
Temat: Re: Thunderbird - kodowanie
Od: Piotr Gałka <p...@c...pl>
W dniu 10-10-2016 o 19:14, Michał Czarkowski pisze:
> W dniu 10.10.2016 o 18:58, Piotr Gałka pisze:
>
>> Nie wiem też, co znaczy ustawienie TB o pisaniu w HTML.
>> P.G.
>
> TB jak thunderbird :-D
>
To mi wyjaśniłeś :)
P.G.
-
25. Data: 2016-10-10 19:21:37
Temat: Re: Thunderbird - kodowanie
Od: "re" <r...@r...invalid>
Użytkownik "Grzegorz Niemirowski"
> Na ile to ogarniam to odpowiadałeś nie na ISO jak myślałeś a na UTF-8.
> Sądzę tak, bo jak zobaczę źródło tamtej wiadomości to gdzieś na początku
> From: widzę UTF-8.
Przyjrzyj się dokładnie, co to jest to "gdzieś" :) Oprócz kodowania
określonego dla treści, kodowanie może być określone też lokalnie dla danego
nagłówka. Jarosław ma polskie literki w imieniu i nazwisku, czyli w nagłówku
From i musi je jakoś zakodować. Są one kodowane w UTF-8 i to kodowanie jest
zadeklarowane w samym tym nagłówku. Z resztą dotyczy to Was obu:
From: =?UTF-8?Q?Jaros=C5=82aw?= =?UTF-8?Q?_Soko=C5=82owski?=
From: =?UTF-8?Q?Piotr_Ga=c5=82ka?= <p...@c...pl>
Natomiast post Jarosława, jeśli chodzi o treść, jak najbardziej był w ISO:
Content-Type: text/plain; charset=iso-8859-2
---
Hehe, ale bzdura. Program w treści używa ISO-8859-2 bo znaki nie wykraczają
poza to kodowanie, ale już w nagłówku, gdzie tym bardziej nie wykraczają,
używa UTF-8. Na co minimalizowanie kodowania jak finalnie używa się
najbardziej problemowego ?!
-
26. Data: 2016-10-10 19:29:34
Temat: Re: Thunderbird - kodowanie
Od: Michał Czarkowski <m...@p...onet.pl>
W dniu 10.10.2016 o 19:15, Piotr Gałka pisze:
> To mi wyjaśniłeś :)
> P.G.
:-D
-
27. Data: 2016-10-10 19:31:19
Temat: Re: Thunderbird - kodowanie
Od: "Grzegorz Niemirowski" <g...@p...onet.pl>
re <r...@r...invalid> napisał(a):
> Hehe, ale bzdura. Program w treści używa ISO-8859-2 bo znaki nie
> wykraczają poza to kodowanie, ale już w nagłówku, gdzie tym bardziej
> nie wykraczają, używa UTF-8.
Jest to niespójne, ale w niczym nie przeszkadza. Swoją drogą to nie jest
UTF-8, tylko UTF-8 zakodowane jeszcze dodatkowo w quoted-printable, bo
nagłówki nie mogą zawierać 8-bitowych znaków. Wychodzi więc potrójna
enkapsulacja, ale każdy się przyzwyczaił :)
> Na co minimalizowanie kodowania jak
> finalnie używa się najbardziej problemowego ?!
Mamy rok 2016 i UTF-8 nie jest problemowe. Jak pokazał przypadek Google
Groups, problemowe staje się ISO, bo jest coraz mniej znane na Zachodzie.
Gdy programista widzi tam dziwny krzaczek to mu się w głowie zapala
zakodowanie go w UTF a nie jakieś strony kodowe, które w porywach pokrywają
kilka krajów. Jak napisałeś obok, problematyczne są jedynie przestarzałe
Polskie Normy. Na grupach czy na stronach WWW możesz bez problemu używać
UTF-8, praktycznie odeszło się już od ISO-8859-2.
--
Grzegorz Niemirowski
http://www.grzegorz.net/
-
28. Data: 2016-10-10 19:34:17
Temat: Re: Thunderbird - kodowanie
Od: Dariusz Dorochowicz <_...@w...com>
W dniu 2016-10-10 o 18:12, Jarosław Sokołowski pisze:
> Pan Michał Czarkowski napisał:
>
>> Dodatkowo, Piotrze, z tego co zauważyłem niedawno wynika,
>> że jeśli odpiszesz thunderbirdem na post w którym użyto
>> kodowania iso odpowiedź będzie w iso, mimo ustawionego
>> kodowanie utf-8. :-D
>
> To akurat nie jest chyba prawdą. Tak będzie, ale pod warunkiem,
> że kodowanie iso-8858-2 *wystarczy* do napisania odpowiedzi.
> Jeśli dołoży się do tekstu te różne omegi, to wiadomość pójdzie
> jednak w UTF-8.
>
> Sam piszę wi ISO, a w odpowiedzi często widuję UTF-8, więc
> raczej mam rację.
Bo to zależy co kto ma ustawione. Obawiam się, że thunderbird nawet przy
ustawieniu 8859-2 po użyciu chociaż jednej pliterki będzie sugerował
użycie UTF-8 aż człowieka zamęczy. Przynajmniej kiedyś tak było. Teraz
default to jest zdaje się UTF-8.
Ustawienie "używaj domyślnego kodowania tekstu w odpowiedziach zawsze
kiedy to możliwe" wyjaśnia chyba wszystko. Ja mam to zaznaczone.
Pozdrawiam
DD
-
29. Data: 2016-10-10 19:41:29
Temat: Re: Thunderbird - kodowanie
Od: Michał Czarkowski <m...@p...onet.pl>
W dniu 10.10.2016 o 19:14, re pisze:
> ---
> Nie odwołał też US-ASCII i co z tego ?
>
> Kodowania ISO-8859-2 nie należy używać bo NIE nadaje się do kodowania
> języka polskiego. Nie ma w nim polskich znaków cudzysłowu. Właściwsze
> byłoby Windows-1250, ale oczywiście nie ma specjalnie potrzeby używania
> jakichkolwiek kodowań stronicowanych skoro jest jednolity Unikod.
>
> "
> UTF-8
> ...
> Wady
> ...
> Rozmiar - każdy znak łaciński w tym kodowaniu zajmuje dwa, zamiast
> jednego bajta
> "
>
> Nonsens. Znaki łacińskie są właśnie kodowane jednobajtowo a wykraczające
> poza łacińskie wielobajtowo (dwu lub WIĘCEJ-bajtowo). Bo UTF-8 to jest
> jeden ze sposobów kodowania Unikodu zorientowany na kompatybilność z
> US-ASCII czyli w praktyce właśnie tą łaciną.
>
> Dalej
> "
> Problemy z BOM - niektóre aplikacje (jak np. notatnik systemu Windows)
> umożliwia zapisywanie plików jedynie za pomocą UTF-8 z BOM.
> "
>
> BOM nie jest problemem tylko zaletą. Dzięki niemu aplikacje unikodowe w
> tym ten Notatnik potrafią zauważyć, że plik został zakodowany w
> Unikodzie. I rozpoznawane są różne kodowania Unikodu a nie tylko Utf-8.
Najprawdopodobniej ,,jesteś w temacie".
Co to jest bom w kontekście notatnika windows?
Bom - drzewce ruchome w omasztowaniu żaglowej jednostki pływającej. (za
wikipedią)
Bom - bill of materials - to, zdaje się, elektronice jest najbliższe.
Znałem jeszcze jedno znaczenie ale już nie pamiętam.
-
30. Data: 2016-10-10 19:49:36
Temat: Re: Thunderbird - kodowanie
Od: Michał Czarkowski <m...@p...onet.pl>
W dniu 10.10.2016 o 18:12, Jarosław Sokołowski pisze:
> Pan Michał Czarkowski napisał:
>
>> Dodatkowo, Piotrze, z tego co zauważyłem niedawno wynika,
>> że jeśli odpiszesz thunderbirdem na post w którym użyto
>> kodowania iso odpowiedź będzie w iso, mimo ustawionego
>> kodowanie utf-8. :-D
>
> To akurat nie jest chyba prawdą. Tak będzie, ale pod warunkiem,
> że kodowanie iso-8858-2 *wystarczy* do napisania odpowiedzi.
> Jeśli dołoży się do tekstu te różne omegi, to wiadomość pójdzie
> jednak w UTF-8.
>
> Sam piszę wi ISO, a w odpowiedzi często widuję UTF-8, więc
> raczej mam rację.
>
Jeszcze jeden test ?????