-
Path: news-archive.icm.edu.pl!news.icm.edu.pl!polsl.pl!not-for-mail
From: Adam Przybyla <a...@r...pl>
Newsgroups: pl.comp.programming
Subject: Re: Wykrywanie sensu (:)
Date: Fri, 13 Aug 2010 08:46:56 +0000 (UTC)
Organization: Politechnika Slaska, Gliwice
Lines: 17
Sender: Adam Przybyla <a...@s...ertel.com.pl>
Message-ID: <i430q0$1nr$1@polsl.pl>
References: <i40dt9$ski$1@news.onet.pl>
NNTP-Posting-Host: smtp.ertel.com.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit
X-Trace: polsl.pl 1281689216 1787 62.182.231.178 (13 Aug 2010 08:46:56 GMT)
X-Complaints-To: n...@p...pl
NNTP-Posting-Date: Fri, 13 Aug 2010 08:46:56 +0000 (UTC)
User-Agent: tin/1.8.3-20070201 ("Scotasay") (UNIX) (Linux/2.6.18-194.8.1.el5xen
(i686))
Xref: news-archive.icm.edu.pl pl.comp.programming:186492
[ ukryj nagłówki ]MoonWolf <m...@p...com> wrote:
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
... jasne, ale w przypadku jezyka polskiego jest to bardzo trudne.
Podejrzewam, ze o ile sam program operujacy na poziomie analizy syntaktycznej bylby
juz trudny
do zrobienia, zwlaszcza, ze musialbys robic wszystko sam,
to juz operowanie na poziomie analizy semantycznej tych wyrazen, ktore zostalyby
wstepnie
zaklasyfikowane jako poprawne bylby o rzad wielkosci trudniejszy w realizacji.
Chocby kwestia odmiany, to ze jezyk polski nie jest jezykiem niepozycyjnym,
brak ogolnie dostepnej wiedzy an ten tamat (poza deklaratywna) to tylko niektore
problemy z jakimi musialbys powalczyc, ale zyczy powodzenia;-) Jedyny pomysl jai mi
przychodzi do glowy, to dorwanie jakiego korpusu jezyka polskiego, wpakowanie
go do bazy z wyszukiwaniem pelnotekstowym ala MySQL z silnikiem Sphinx'a, a potem
heurystyczna analiza wynikow. Oczywiscie, heurystyka do znalezienia we wlasnym
zakresie;-)
Z powazaniem
Adam Przybyla
Następne wpisy z tego wątku
- 20.08.10 15:19 Sebastian Kaliszewski
- 20.08.10 16:55 Waldek M.
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-14 nie lekceważ termostatu
- 2024-12-14 numer 112
- 2024-12-14 Pendrive, ale dysk
- 2024-12-12 Autocom CAN CDP+ wysokie kody błędów
- 2024-12-13 termostat do lodowki
- 2024-12-13 Gdańsk => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-13 Warszawa => Head of International Freight Forwarding Department <=
- 2024-12-13 Poznań => Employer Branding Specialist <=
- 2024-12-13 Kraków => Business Development Manager - Dział Sieci i Bezpieczeńst
- 2024-12-13 Kraków => Business Development Manager - Network and Network Security
- 2024-12-13 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-13 Gdańsk => Programista Full Stack .Net <=
- 2024-12-13 Warszawa => Analityk Biznesowo-Systemowy <=
- 2024-12-13 Białystok => Architekt rozwiązań (doświadczenie w obszarze Java, A
- 2024-12-13 Wrocław => Application Security Engineer <=