-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!news.task.gda.pl!not-for-mail
From: Daniel Janus <d...@d...pl>
Newsgroups: pl.comp.programming
Subject: Re: Oszczędne kodowanie form gramatycznych
Date: Wed, 12 Feb 2014 12:34:04 +0000 (UTC)
Organization: CI TASK http://www.task.gda.pl/
Lines: 14
Message-ID: <s...@s...mimuw.edu.pl>
References: <lbrahh$kqr$1@node2.news.atman.pl>
Reply-To: d...@d...pl
NNTP-Posting-Host: students.mimuw.edu.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=iso-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: news.task.gda.pl 1392208444 2185 2001:6a0:5001:1::3 (12 Feb 2014 12:34:04
GMT)
X-Complaints-To: a...@n...task.gda.pl
NNTP-Posting-Date: Wed, 12 Feb 2014 12:34:04 +0000 (UTC)
User-Agent: slrn/0.9.9p1 (Linux)
Xref: news-archive.icm.edu.pl pl.comp.programming:205119
[ ukryj nagłówki ]Dnia 23.01.2014 Borneq <b...@a...hidden.pl> napisał/a:
> W języku polskim, w odróżnieniu od np. angielskiego większość wyrazów
> może mieć bardzo wiele form. W jaki sposób je oszczędnie zapamiętać, aby
> nie pamiętać ich wszystkich, tylko wyraz główny i regułę. W morfologiku
> np. są wszystkie formy co powoduje, że plik jest znacznych rozmiarów.
Zobacz sobie morfologik-stemming -- tam jest stosowana bardzo efektywna
kompresja, dzięki czemu jar ze słownikiem ma ledwo kilka MB.
--
Daniel Janus <d...@d...pl> | http://danieljanus.pl
Perl is "311 code" (chmod 311 *.pl); writer can write and execute,
his team and the world can execute, nobody can read.
-- Chris Shiflett
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-14 Pendrive, ale dysk
- 2024-12-12 Autocom CAN CDP+ wysokie kody błędów
- 2024-12-13 termostat do lodowki
- 2024-12-13 Gdańsk => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-13 Warszawa => Head of International Freight Forwarding Department <=
- 2024-12-13 Poznań => Employer Branding Specialist <=
- 2024-12-13 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2024-12-13 Kraków => Business Development Manager - Network and Network Security
- 2024-12-13 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-13 Gdańsk => Programista Full Stack .Net <=
- 2024-12-13 Warszawa => Analityk Biznesowo-Systemowy <=
- 2024-12-13 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2024-12-13 Wrocław => Application Security Engineer <=
- 2024-12-13 Katowice => Head of Virtualization Platform Management and Operating S
- 2024-12-13 Lublin => Programista Delphi <=