-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!news.nask.pl!news.nask.org.pl!news.unit
0.net!eternal-september.org!feeder.eternal-september.org!news.eternal-september
.org!.POSTED!not-for-mail
From: Piotr Chamera <p...@p...onet.pl>
Newsgroups: pl.comp.programming
Subject: Re: python i stringi
Date: Thu, 6 Oct 2016 11:50:55 +0200
Organization: A noiseless patient Spider
Lines: 59
Message-ID: <nt56ph$s0u$1@dont-email.me>
References: <1...@t...com> <nt53kl$ia8$1@dont-email.me>
<1b3k49416pl4p$.dlg@tyczka.com>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Date: Thu, 6 Oct 2016 09:50:41 -0000 (UTC)
Injection-Info: mx02.eternal-september.org;
posting-host="e74bb43196db5bb17056677d8cc011e4";
logging-data="28702";
mail-complaints-to="a...@e...org";
posting-account="U2FsdGVkX1/gZjoM1As+5O/AfPKPVd/w"
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:45.0) Gecko/20100101
Thunderbird/45.3.0
In-Reply-To: <1b3k49416pl4p$.dlg@tyczka.com>
Cancel-Lock: sha1:tRCgU41Lj+hfWSy3uwzKkC/ZZ0Y=
Xref: news-archive.icm.edu.pl pl.comp.programming:209874
[ ukryj nagłówki ]W dniu 2016-10-06 o 11:22, Roman Tyczka pisze:
> On Thu, 6 Oct 2016 10:57:07 +0200, Piotr Chamera wrote:
>
>>> Jak wybrnąć i policzyć jednak tego hasha?
>>>
>>> ps. python 2.7.9 na windows
>>>
>>
>> np tak:
>> >>> hashlib.md5(ustr.encode(encoding="utf-8", errors="strict")).hexdigest()
>>
>> '32857a03910f204bd5adc4cb2ec2bce8'
>>
>> lub tak:
>> >>> hashlib.md5(ustr.encode(encoding="utf-16",
>> errors="strict")).hexdigest()
>>
>> '5da8f084e4da17f9441beccf2fa8b437'
>>
>> czyli trzeba jawnie skonwertować tekst unicode do takiego formatu, z
>> jakiego chcemy liczyć md5
>
> A jaki jest domyślny format, gdy zmienną utworzyłem tak:
>
>>>> ustr = u"Jeszcze dłuższy i bardzo długi string z ółęść oraz ;%$#@[ i innymi
znakami 0099786764553 na końcu"
>>>> type(ustr)
> <type 'unicode'>
>
> To jest utf-8? 16? 32?
>
String na wejściu jest wg kodowania ustawionego na konsoli lub w pliku
(często jest to utf-8, w pythonie 3 pliki źródłowe domyślnie są czytane
jako utf-8, w 2.x trzeba to było zadeklarować na początku pliku)
konwertowany do wewnętrznej reprezentacji.
String unicode w pythonie potrafi reprezentować wszystkie znaki
standardu unicode (chyba), ale nie wiemy (nie potrzebujemy wiedzieć) w
jakim formacie jest trzymany w pamięci (czy jako liczba 32 bitowa w
wersji 32bit, a 64 bitowa na procesorach 64 bit, czy jakiś inny obiekt).
Jeśli potrzebujemy konwersji na ciąg w określonym formacie, musimy to
jawnie przekodować na ciąg bajtów, np.:
>>> ustr.encode(encoding="utf-32", errors="strict")
'\xff\xfe\x00\x00J\x00\x00\x00e\x00\x00\x00s\x00\x00
\x00z\x00\x00\x00c\x00\x00\x00z\x00\x00\x00e\x00\x00
\x00
\x00\x00\x00d\x00\x00\x00B\x01\x00\x00u\x00\x00\x00|
\x01\x00\x00s\x00\x00\x00z\x00\x00\x00y\x00\x00\x00
\x00\x00\x00i\x00\x00\x00
\x00\x00\x00b\x00\x00\x00a\x00\x00\x00r\x00\x00\x00d
\x00\x00\x00z\x00\x00\x00o\x00\x00\x00
\x00\x00\x00d\x00\x00\x00B\x01\x00\x00u\x00\x00\x00g
\x00\x00\x00i\x00\x00\x00
\x00\x00\x00s\x00\x00\x00t\x00\x00\x00r\x00\x00\x00i
\x00\x00\x00n\x00\x00\x00g\x00\x00\x00
\x00\x00\x00z\x00\x00\x00
\x00\x00\x00\xf3\x00\x00\x00B\x01\x00\x00\x19\x01\x0
0\x00[\x01\x00\x00\x07\x01\x00\x00
\x00\x00\x00o\x00\x00\x00r\x00\x00\x00a\x00\x00\x00z
\x00\x00\x00
\x00\x00\x00;\x00\x00\x00%\x00\x00\x00$\x00\x00\x00#
\x00\x00\x00@\x00\x00\x00[\x00\x00\x00
\x00\x00\x00i\x00\x00\x00
\x00\x00\x00i\x00\x00\x00n\x00\x00\x00n\x00\x00\x00y
\x00\x00\x00m\x00\x00\x00i\x00\x00\x00
\x00\x00\x00z\x00\x00\x00n\x00\x00\x00a\x00\x00\x00k
\x00\x00\x00a\x00\x00\x00m\x00\x00\x00i\x00\x00\x00
\x00\x00\x000\x00\x00\x000\x00\x00\x009\x00\x00\x009
\x00\x00\x007\x00\x00\x008\x00\x00\x006\x00\x00\x007
\x00\x00\x006\x00\x00\x004\x00\x00\x005\x00\x00\x005
\x00\x00\x003\x00\x00\x00
\x00\x00\x00n\x00\x00\x00a\x00\x00\x00
\x00\x00\x00k\x00\x00\x00o\x00\x00\x00D\x01\x00\x00c
\x00\x00\x00u\x00\x00\x00'
Następne wpisy z tego wątku
- 06.10.16 12:14 Piotr Chamera
- 06.10.16 12:32 Roman Tyczka
- 06.10.16 13:22 Piotr Chamera
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-03-15 China-Kraków => Key Account Manager IT <=
- 2025-03-14 Spalił się autobus :-)
- 2025-03-14 Policjanci z Piątku
- 2025-03-14 Lublin => JavaScript / Node / Fullstack Developer <=
- 2025-03-14 Warszawa => Account Manager - Sprzedaż Usług Rekrutacyjnych <=
- 2025-03-14 Gliwice => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2025-03-14 VAT-R Umowa najmu na adres zamieszkania
- 2025-03-14 Gliwice => IT Expert (Network Systems area) <=
- 2025-03-14 Warszawa => Junior Rekruter <=
- 2025-03-14 Wrocław => Konsultant wdrożeniowy Comarch XL/Optima (Księgowość i
- 2025-03-14 China-Kraków => Senior PHP Symfony Developer <=
- 2025-03-14 Żerniki => Dyspozytor Międzynarodowy <=
- 2025-03-13 Raspberry Pi 3 Model B+
- 2025-03-13 Kuchenka elektryczna
- 2025-03-12 test