-
Data: 2013-02-18 13:39:04
Temat: Re: Ciekawy program...
Od: Edek Pienkowski <e...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Dnia Sun, 17 Feb 2013 20:06:01 -0800, M.M. wyszeptal:
> W dniu poniedziałek, 18 lutego 2013 03:34:05 UTC+1 użytkownik Edek Pienkowski
napisał:
>> Dnia Sun, 17 Feb 2013 18:18:01 -0800, M.M. wyszeptal:
>> >> Wyszłoby to co opisałeś: miałbyś statystykę, który wyraz
>> >> występuje częściej po innym wyrazie niż inny. Do
>> >> uczenia gramatyki jest daleko, od semantyki dzieli przepaść.
>> > Niestety to prawda.
>
>> Prawda: to znaczy co jest prawdą?
> Prawdą jest że do uczenia gramatyki/semantyki pozostał przepaść.
> Niemniej z czystej ciekawości chciałbym zobaczyć jak się
> uczy taki prosty program.
Nie uczy się tego akurat najczęściej, bo reguły gramatyczne
są znane i proste do zahardkodowania.
>> Metody probabilistyczne
>> jak najbardziej działają, tyle że to był trywialny przykład.
>> Lepszym modelem uczenia struktury są hidden markov chains.
> Na czym polega ta technika tak na chłopski rozum? Strzelam: rzutuje
> się frazy na jakieś stany i potem prawdopodobieństwo że wyraz
> xxx tłumaczy się jako yyy jeśli poprzednie stany były sss ?
Reprezentuje takie reguły jak to, że w języku angielskim
czasownik po czasowniku oznacza a) formę gramatyczną, b)
jak w większości języków jeden z czasowników jest czynnością
będącą obiektem drugiej czynności: "przestał ciągnąć Jasia za
nogę" c) koljeny czasownik ropoczyna kolejne zdanie podrzędne.
Raczej nie technika, a wynik badań kilkulatków. Sam model
nie załatwia wszystkiego - język jest bardzo mocno powiązany
ze znaczeniem, w tym tak prymitywnym jak obiekt lub dwa lub
trzy i czynność. Ma to związek zarówno z ewolucją języka
jak i jego nauką - dwie strony tej samej monety.
Implementując najczęściej używa się WordNet - wyrazy pogrupowane
w rzeczowniki, czasowniki, przymiotniki i przysłówki, plus odrobinę
informacji o wiązaniu gramatycznym, co pośrednio oddaje część
prymitywnej semantyki (obiekt, dwa lub trzy). Uczenie się
świata na podstawie pierwszych obiektów ("maaama: pilkaaa")
zajęłoby za długo. Uczenie się gramatyki prawdopodobnie też.
WordNet plus kilka reguł gramatycznych pozwala na rozbiór
gramatyczny zdania, od dawna.
Watson używa WordNet, a do semantyki ontologii, jeżeli od pewnego
momentu potrafi z języka pisanego rozbudowywać własne (doczytam
linki w wiki) to te pierwsze plus ustrukturyzowa wiedza
dają w swoistym sensie bootstrap.
--
Edek
Następne wpisy z tego wątku
- 18.02.13 14:22 Edek Pienkowski
- 18.02.13 15:02 Edek Pienkowski
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-03-03 Pruszków => Specjalista ds. public relations <=
- 2025-03-03 Białystok => System Architect (Java background) <=
- 2025-03-03 Białystok => System Architect (background deweloperski w Java) <=
- 2025-03-03 China-Kraków => Senior PHP Symfony Developer <=
- 2025-03-03 China-Kraków => Senior PHP Symfony Developer <=
- 2025-03-03 Warszawa => Data Engineer (Tech Lead) <=
- 2025-03-03 Gliwice => Ekspert IT (obszar systemów sieciowych) <=
- 2025-03-03 Gliwice => IT Expert (Network Systems area) <=
- 2025-03-03 Mińsk Mazowiecki => Area Sales Manager OZE <=
- 2025-03-03 Warszawa => Spedytor Międzynarodowy <=
- 2025-03-03 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-03-03 Katowice => Key Account Manager (ERP) <=
- 2025-03-02 Tusk idzie na rekord deportacji po 1989 [Będzie popyt na prawników]
- 2025-03-01 Obywatel telefonuje 112 lub 986
- 2025-03-01 detektyw (?) Rutkowski działał jako prasa