-
11. Data: 2016-10-06 13:22:54
Temat: Re: python i stringi
Od: Piotr Chamera <p...@p...onet.pl>
W dniu 2016-10-06 o 12:32, Roman Tyczka pisze:
> On Thu, 6 Oct 2016 12:14:00 +0200, Piotr Chamera wrote:
>
>>> Jeśli chcesz mi utrzeć nosa tym googlem to ...hmmm, niepotrzebnie. Od
>>> googla zacząłem. Ale ok, może grupa dyskusyjna służy tylko do kłótni o
>>> pascala.
>>> Tak czy owak problem rozwiązałem, nie konwertując do ascii czy tablicy
>>> bajtów, ale poprawnie deklarując typ unicodowego stringa. I na taką
>>> praktyczną radę liczyłem.
>>
>> Dla jasności - nie zadeklarowałeś typu unicodowego stringa, ale za
>> pomocą metody (encode) obiektu (ustr, typu unicode) utworzyłeś nowy
>> ciąg bajtów reprezentujący ten ciąg znaków w kodowaniu, które podałeś
>> jako argument metody. Obiekt pod zmienną ,,ustr" pozostał niezmieniony.
>
> Obiekt został zmieniony, ale nie w sensie adresu/instancji, lecz zmienił
> się jego stan wewnętrzny, czyli tablica bajtów zawierająca łańcuch :-)
Może trochę namieszałem. Chodzi o to, że do zmiennej ustr, przypisałeś
zupełnie nowy obiekt, ciąg bajtów utworzony przez metodę encode,
zawierający reprezentację stringa w postaci ciągu bajtów zgodnego
z zadanym kodowaniem.
Czyli to zdanie:
>>> Tak czy owak problem rozwiązałem, nie konwertując do ascii czy
>>> tablicy bajtów, ale poprawnie deklarując typ unicodowego stringa.
jest nieprawdziwe. Oryginalny obiekt typu unicode nie został zmieniony.
Pamiętaj, że zmienne w pythonie są tylko etykietkami (wskaźnikami) do
obiektów.
Rozważ taki ciąg działań
>>> ustr = u"test ąę"
>>> type(ustr)
<type 'unicode'>
>>> id(ustr)
58766080L
>>> ustr2 = ustr
>>> id(ustr2)
58766080L
id obiektów podpiętych pod zmienne jest takie samo, obie pokazują na ten
sam obiekt
>>> ustr = ustr.encode('utf-16le')
teraz do ustr przypisaliśmy nowy obiekt o innym id (trzeba pamiętać, że
w pythonie 2.x typ 'str' i ciąg bajtów to to samo)
>>> id(ustr)
58767040L
>>> type(ustr)
<type 'str'>
ale poprzedni obiekt pozostał niezmieniony, chociaż teraz jest już
przypięty tylko do zmiennej ustr2.
>>> id(ustr2)
58766080L
>>> ustr2
u'test \u0105\u0119'