-
Data: 2014-02-12 13:34:04
Temat: Re: Oszczędne kodowanie form gramatycznych
Od: Daniel Janus <d...@d...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Dnia 23.01.2014 Borneq <b...@a...hidden.pl> napisał/a:
> W języku polskim, w odróżnieniu od np. angielskiego większość wyrazów
> może mieć bardzo wiele form. W jaki sposób je oszczędnie zapamiętać, aby
> nie pamiętać ich wszystkich, tylko wyraz główny i regułę. W morfologiku
> np. są wszystkie formy co powoduje, że plik jest znacznych rozmiarów.
Zobacz sobie morfologik-stemming -- tam jest stosowana bardzo efektywna
kompresja, dzięki czemu jar ze słownikiem ma ledwo kilka MB.
--
Daniel Janus <d...@d...pl> | http://danieljanus.pl
Perl is "311 code" (chmod 311 *.pl); writer can write and execute,
his team and the world can execute, nobody can read.
-- Chris Shiflett
Najnowsze wątki z tej grupy
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
Najnowsze wątki
- 2025-02-06 PROGRAM DOPŁAT DO AUT ELEKTRYCZNYCH TO ABSURD. ZA ŚRODKI Z KPO KUPIMY NIEMIECKIE I CHIŃSKIE AUTA
- 2025-02-05 ceny OC
- 2025-02-05 Re: ceny OC
- 2025-02-05 Re: ceny OC
- 2025-02-07 Smar do video
- 2025-02-06 Litowe baterie AA Li/FeS2 a alkaliczne
- 2025-02-07 Gliwice => Business Development Manager - Network and Network Security
- 2025-02-07 Warszawa => System Architect (Java background) <=
- 2025-02-07 Warszawa => System Architect (background deweloperski w Java) <=
- 2025-02-07 Warszawa => Solution Architect (Java background) <=
- 2025-02-07 Gliwice => Ekspert IT (obszar systemów sieciowych) <=
- 2025-02-07 Lublin => Programista Delphi <=
- 2025-02-07 Warszawa => Architekt rozwiązań (doświadczenie w obszarze Java, AWS
- 2025-02-07 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-07 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo