-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!news.nask.pl!news.nask.org.pl!news.unit0.net!eternal-september.org!fee
der.eternal-september.org!mx02.eternal-september.org!.POSTED!not-for-mail
From: Piotr Chamera <p...@p...onet.pl>
Newsgroups: pl.comp.programming
Subject: Re: Unicode - utożsamianie znaków akcentowanych
Date: Mon, 6 Jun 2016 09:28:32 +0200
Organization: A noiseless patient Spider
Lines: 30
Message-ID: <nj38n7$jcv$1@dont-email.me>
References: <nj0j8a$8pn$1@node2.news.atman.pl> <nj1a8k$q6v$1@node1.news.atman.pl>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 8bit
Injection-Date: Mon, 6 Jun 2016 07:28:39 -0000 (UTC)
Injection-Info: mx02.eternal-september.org;
posting-host="027a6075cb6e50d57881e5c65f47fc6e";
logging-data="19871";
mail-complaints-to="a...@e...org";
posting-account="U2FsdGVkX1/Ggi3DS+3YsdHsPCVzfwBP"
User-Agent: Mozilla/5.0 (Windows NT 6.3; WOW64; rv:45.0) Gecko/20100101
Thunderbird/45.1.1
In-Reply-To: <nj1a8k$q6v$1@node1.news.atman.pl>
Cancel-Lock: sha1:y+w7HZBMyMqNI8UnPo80F43h+Gc=
Xref: news-archive.icm.edu.pl pl.comp.programming:209447
[ ukryj nagłówki ]W dniu 2016-06-05 o 15:42, Borneq pisze:
> W dniu 05.06.2016 o 09:10, Borneq pisze:
>> Jak zamieniać wszelkie ą, a z akcentem, a z kółeczkiem itp na a?
>
> Albo skąd wziąć nawy liter Unicode? http://unicodelookup.com/#latin/1
> podaje te nazwy, dla których występuje "latin"a jest ich aż 1081.
> Strona jest online, potrzebuję nazw offline i jak zrobić szybką
> konwersję? czy potrzeba tablicy 65536*2 bajty?
Wszystkie potrzebne dane powinny byś w ,,Unicode Character Database"
(http://www.unicode.org/ucd/) - to część standardu Unicode i jest
dostępna w różnych formatach. Pewnie da się znaleźć biblioteki w
potrzebnym języku programowania, które dają dostęp do zawartych w tej
bazie informacji (np ICU - http://site.icu-project.org/).
Odnośnie zamiany znaków interesujące powinno być to:
https://en.wikipedia.org/wiki/Unicode_equivalence
i to
http://www.unicode.org/reports/tr15/tr15-43.html
Dla twoich potrzeb interesująca może być ta tablica z biblioteki ICU
http://bugs.icu-project.org/trac/browser/icu/trunk/s
ource/data/unidata/norm2/nfc.txt
od wiersza 347 mamy dekompozycje znaków, przykładowo dla ,,ą",
unicode 0105, mamy dekompozycję 0061 0328 czyli a + ogonek
O składni pliku nfc.txt jest tutaj
http://userguide.icu-project.org/transforms/normaliz
ation
Następne wpisy z tego wątku
- 06.06.16 09:44 Borneq
Najnowsze wątki z tej grupy
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
Najnowsze wątki
- 2025-04-25 Sprawdzić czy spółka ma sprawy w sądzie
- 2025-04-25 Solarny Palnik Wodorowy
- 2025-04-25 amperomierz w plusie
- 2025-04-25 nie wyłączam silnika
- 2025-04-25 PILNE !! Stara żywność w marketach "Zgodnie z obowiązującym od stycznia 2024 r. prawem przeterminowana, ale nadal zdatna do spożycia żywność, może być sprzedawana przez maksymalnie kolejne 45 dni po dacie na opakowaniu. To legalne tylko wtedy, gdy opakowa
- 2025-04-25 Łódź => Team Lead Data Engineer (Snowflake) <=
- 2025-04-25 Pruszków => Key Account Manager IT <=
- 2025-04-25 Warszawa => Business Development Manager - Network and Network Securit
- 2025-04-25 Kto używa elektrolizera do wytwarzania wodoru do palnika ?
- 2025-04-25 Kraków => PHP Developer (Full Stack) <=
- 2025-04-25 Trójmiasto => Head of Social Media <=
- 2025-04-25 Poznań => Konsultant wdrożeniowy Comarch XL (Logistyka, WMS, Produkc
- 2025-04-25 Warszawa => Developer .Net <=
- 2025-04-25 Warszawa => Support Engineer <=
- 2025-04-25 Warszawa => Team Lead Data Engineer (obszar Snowflake) <=