Wykrywanie sensu (:) - Grupy dyskusyjne w eGospodarka.pl

eGospodarka.pl › Grupy › pl.comp.programming › Wykrywanie sensu (:)

« poprzedni wątek

następny wątek »

Ilość wypowiedzi w tym wątku: 28

21. Data: 2010-08-12 21:32:07
Temat: Re: Wykrywanie sensu (:)
Od: Segmentation Fault <c...@o...eu>

On 08/12/2010 11:12 AM, MoonWolf wrote:
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
>

poczytaj o kryptoanalizie

[ pokaż wiadomość z nagłówkami ]

do góry
22. Data: 2010-08-12 21:37:08
Temat: Re: Wykrywanie sensu (:)
Od: Segmentation Fault <c...@o...eu>

On 08/12/2010 07:05 PM, Mariusz Kruk wrote:
> epsilon$ while read LINE; do echo \>"$LINE"; done < "Mariusz Marszałkowski"
>>>> Jeśli zupełnie przypadkowy ciąg znaków chcesz odróżnić od zdania
>>>> w j. polskim, to bardzo proste.
>>> Chyba jeśli masz na myśli konkretne zdanie ;-)
>> Poprawne zdanie kontra losowy ciąg znaków,
>
> OK. To teraz śmiertelnie poważnie - jesteś w stanie zweryfikować
> choćby gramatyczną poprawność zdania? Bo ja się nie podejmuję.
> Zwłaszcza w wypadku zdań złożonych.
>

Powstało kilka opisów formalnych gramatyk języków naturalnych,
w tym gramatyki języka polskiego. Powstało też kilka metajęzyków
ułatwiających opisywanie gramatyk języków naturalnych ;)

Te formalne opisy radzą sobie z dużą ilością zdań, ale nie ze
wszystkimi. Łatwo wygenerować złośliwe zdania.

[ pokaż wiadomość z nagłówkami ]

do góry
23. Data: 2010-08-12 23:11:44
Temat: Re: Wykrywanie sensu (:)
Od: Daniel Janus <d...@d...pl>

Dnia 12.08.2010 Mariusz Kruk <M...@e...eu.org> napisał/a:
> epsilon$ while read LINE; do echo \>"$LINE"; done < "Mariusz Marszałkowski"
>>> >Jeśli zupełnie przypadkowy ciąg znaków chcesz odróżnić od zdania
>>> >w j. polskim, to bardzo proste.
>>> Chyba jeśli masz na myśli konkretne zdanie ;-)
>>Poprawne zdanie kontra losowy ciąg znaków,
>
> OK. To teraz śmiertelnie poważnie - jesteś w stanie zweryfikować
> choćby gramatyczną poprawność zdania? Bo ja się nie podejmuję.
> Zwłaszcza w wypadku zdań złożonych.

Dobrym przybliżeniem może być przepuszczenie przez Świgrę:

http://nlp.ipipan.waw.pl/~wolinski/swigra

pozdrawiam,
Daniel

[ pokaż wiadomość z nagłówkami ]

do góry
24. Data: 2010-08-13 06:53:51
Temat: Re: Wykrywanie sensu (:)
Od: "slawek" <s...@h...pl>

Użytkownik "Maciej Sobczak" <s...@g...com> napisał w wiadomości
grup
dyskusyjnych:465f7f28-9acc-433f-b920-9e2182b51a65@z2
8g2000yqh.googlegroups.com...
> http://www.museumofhoaxes.com/hoax/weblog/permalink/
automatic_paper_generator/
> http://pdos.csail.mit.edu/scigen/

Znany i lubiany. Tyle że on generuje z większych klocków. Podobnie jak
generatory tworzące tekst na podstawie gramatyki (niekoniecznie naturalnego
języka).

slawek

[ pokaż wiadomość z nagłówkami ]

do góry
25. Data: 2010-08-13 07:17:49
Temat: Re: Wykrywanie sensu (:)
Od: Mariusz Kruk <M...@e...eu.org>

epsilon$ while read LINE; do echo \>"$LINE"; done < "Segmentation Fault"
>Te formalne opisy radzą sobie z dużą ilością zdań, ale nie ze
>wszystkimi.

No i o to chodzi.

--
\.\.\.\.\.\.\.\.\.\.\.\.\.\
.\....@e...eu.org.\.\.
\.http://epsilon.eu.org/\.\
.\.\.\.\.\.\.\.\.\.\.\.\.\.

[ pokaż wiadomość z nagłówkami ]

do góry
26. Data: 2010-08-13 08:46:56
Temat: Re: Wykrywanie sensu (:)
Od: Adam Przybyla <a...@r...pl>

MoonWolf <m...@p...com> wrote:
> Zastanawiam się czy istnieje sposób na wykrycie 'sensu' w ciągu znaków.
> Chodzi o sprawdzenie czy jest to przypadkowy ciąg, czy też zdanie w
> języku polskim. Da się coś takiego zrobić?
... jasne, ale w przypadku jezyka polskiego jest to bardzo trudne.
Podejrzewam, ze o ile sam program operujacy na poziomie analizy syntaktycznej bylby
juz trudny
do zrobienia, zwlaszcza, ze musialbys robic wszystko sam,
to juz operowanie na poziomie analizy semantycznej tych wyrazen, ktore zostalyby
wstepnie
zaklasyfikowane jako poprawne bylby o rzad wielkosci trudniejszy w realizacji.
Chocby kwestia odmiany, to ze jezyk polski nie jest jezykiem niepozycyjnym,
brak ogolnie dostepnej wiedzy an ten tamat (poza deklaratywna) to tylko niektore
problemy z jakimi musialbys powalczyc, ale zyczy powodzenia;-) Jedyny pomysl jai mi
przychodzi do glowy, to dorwanie jakiego korpusu jezyka polskiego, wpakowanie
go do bazy z wyszukiwaniem pelnotekstowym ala MySQL z silnikiem Sphinx'a, a potem
heurystyczna analiza wynikow. Oczywiscie, heurystyka do znalezienia we wlasnym
zakresie;-)
Z powazaniem
Adam Przybyla

[ pokaż wiadomość z nagłówkami ]

do góry
27. Data: 2010-08-20 15:19:17
Temat: Re: Wykrywanie sensu (:)
Od: Sebastian Kaliszewski <s...@r...this.informa.and.that.pl>

Jacek Czerwinski wrote:
> W dniu 2010-08-12 14:20, Mariusz Marszałkowski pisze:
>> On 12 Sie, 11:12, MoonWolf<m...@p...com> wrote:
>
>> Jeśli zupełnie przypadkowy ciąg znaków chcesz odróżnić od zdania
>> w j. polskim, to bardzo proste. Jeśli chcesz żeby program powiedział,
>> czy przeciętny kowalski to zdanie zrozumie, to bardzo trudne.
>
> Od dawna, w kregach unixowych na gruncie angielskiego jest narzedzie
> oceniajace zlozonosc tekstu i podatnosc na zrozumienie przez
> statystycznego Smitha. Kojarze jak przez mgle, chodzilo o dlugosci
> zdania, ilosc spojnikow (czyli zwiazki ze zdaniami podrzednymi), tego
> typu algorytmy. Oczywiscie byl mozliwy sztuczny teskt ktory dostanie
> dobry ranking.
>
> Byc moze narzedzia do analizy stylistycznej w procesorach tekstu?
>
> Slawny "dolore ipsum" pokazuje, jak bardzo sztuczny tekst moze upodobnic
> sie do naturalnego jezyka.

Lorem ipsum to wszak prawdziwy tekst -- AFAIR toto cytata z Tacyta :)

pzdr
\SK
--
"Never underestimate the power of human stupidity" -- L. Lang
--
http://www.tajga.org -- (some photos from my travels)

[ pokaż wiadomość z nagłówkami ]

do góry
28. Data: 2010-08-20 16:55:10
Temat: Re: Wykrywanie sensu (:)
Od: "Waldek M." <w...@l...localdomain>

Dnia Fri, 20 Aug 2010 17:19:17 +0200, Sebastian Kaliszewski napisał(a):
> Lorem ipsum to wszak prawdziwy tekst -- AFAIR toto cytata z Tacyta :)

Prawie cytat i prawie z Tacyta:
http://pl.wikipedia.org/wiki/Lorem_ipsum

Tak twierdzi prawie encyklopedia.;-)

Pozdrawiam,
Waldek

[ pokaż wiadomość z nagłówkami ]

do góry