-
Data: 2014-01-23 15:55:45
Temat: Oszczędne kodowanie form gramatycznych
Od: Borneq <b...@a...hidden.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W języku polskim, w odróżnieniu od np. angielskiego większość wyrazów
może mieć bardzo wiele form. W jaki sposób je oszczędnie zapamiętać, aby
nie pamiętać ich wszystkich, tylko wyraz główny i regułę. W morfologiku
np. są wszystkie formy co powoduje, że plik jest znacznych rozmiarów.
A teraz mamy takie coś jak słownik korekty języka polskiego dla peceta
lub smartfona, czy też klawiaturę dla smartfona. Słownik cały czas
siedzi w pamięci, więc chcemy aby był w miarę nieduży.
A jak to jest rozwiązane w istniejącej korekcie pisowni? Zdaje się, że
słowniki są nawet dublowane, np. inny słownik używa Word, inny Firefox,
a jeszcze inny Chrome, zjadają pamięć, ale chyba nie ma tam wszystkich form.
Na przykład działająca klawiatura XPeria liczy 8.2 MB, a gdyby tam
pamiętać wszystkie formy choćby tylko dla języka polskiego, to mogła by
liczyć np. nie 8.2 a a 82 MB.
Następne wpisy z tego wątku
- 25.01.14 19:55 Wojciech Muła
- 09.02.14 13:22 Borneq
- 12.02.14 13:34 Daniel Janus
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-14 światła znów wlączyli
- 2024-12-14 nie lekceważ termostatu
- 2024-12-14 numer 112
- 2024-12-14 Pendrive, ale dysk
- 2024-12-12 Autocom CAN CDP+ wysokie kody błędów
- 2024-12-13 termostat do lodowki
- 2024-12-13 Gdańsk => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-13 Warszawa => Head of International Freight Forwarding Department <=
- 2024-12-13 Poznań => Employer Branding Specialist <=
- 2024-12-13 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2024-12-13 Kraków => Business Development Manager - Network and Network Security
- 2024-12-13 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-13 Gdańsk => Programista Full Stack .Net <=
- 2024-12-13 Warszawa => Analityk Biznesowo-Systemowy <=
- 2024-12-13 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A