-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!.POSTED!not-for-mail
From: Edek Pienkowski <e...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: Ciekawy program...
Date: Mon, 18 Feb 2013 12:39:04 +0000 (UTC)
Organization: ATMAN - ATM S.A.
Lines: 53
Message-ID: <kft7d8$c2h$1@node2.news.atman.pl>
References: <552r54uih227$.1sjw2dke9nhql.dlg@40tude.net>
<3...@g...com>
<k...@4...net>
<0...@g...com>
<kfbok8$nad$1@mx1.internetia.pl>
<1...@g...com>
<kfbvf0$mdr$2@somewhere.invalid>
<4...@g...com>
<kfo51r$kik$2@node1.news.atman.pl>
<b...@g...com>
<kfs14f$9tk$1@node2.news.atman.pl>
<2...@g...com>
<kfs3ut$bm0$1@node2.news.atman.pl>
<4...@g...com>
NNTP-Posting-Host: 77-255-207-227.adsl.inetia.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: node2.news.atman.pl 1361191144 12369 77.255.207.227 (18 Feb 2013 12:39:04
GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Mon, 18 Feb 2013 12:39:04 +0000 (UTC)
User-Agent: Pan/0.139 (Sexual Chocolate; GIT bf56508 git://git.gnome.org/pan2)
Xref: news-archive.icm.edu.pl pl.comp.programming:202079
[ ukryj nagłówki ]Dnia Sun, 17 Feb 2013 20:06:01 -0800, M.M. wyszeptal:
> W dniu poniedziałek, 18 lutego 2013 03:34:05 UTC+1 użytkownik Edek Pienkowski
napisał:
>> Dnia Sun, 17 Feb 2013 18:18:01 -0800, M.M. wyszeptal:
>> >> Wyszłoby to co opisałeś: miałbyś statystykę, który wyraz
>> >> występuje częściej po innym wyrazie niż inny. Do
>> >> uczenia gramatyki jest daleko, od semantyki dzieli przepaść.
>> > Niestety to prawda.
>
>> Prawda: to znaczy co jest prawdą?
> Prawdą jest że do uczenia gramatyki/semantyki pozostał przepaść.
> Niemniej z czystej ciekawości chciałbym zobaczyć jak się
> uczy taki prosty program.
Nie uczy się tego akurat najczęściej, bo reguły gramatyczne
są znane i proste do zahardkodowania.
>> Metody probabilistyczne
>> jak najbardziej działają, tyle że to był trywialny przykład.
>> Lepszym modelem uczenia struktury są hidden markov chains.
> Na czym polega ta technika tak na chłopski rozum? Strzelam: rzutuje
> się frazy na jakieś stany i potem prawdopodobieństwo że wyraz
> xxx tłumaczy się jako yyy jeśli poprzednie stany były sss ?
Reprezentuje takie reguły jak to, że w języku angielskim
czasownik po czasowniku oznacza a) formę gramatyczną, b)
jak w większości języków jeden z czasowników jest czynnością
będącą obiektem drugiej czynności: "przestał ciągnąć Jasia za
nogę" c) koljeny czasownik ropoczyna kolejne zdanie podrzędne.
Raczej nie technika, a wynik badań kilkulatków. Sam model
nie załatwia wszystkiego - język jest bardzo mocno powiązany
ze znaczeniem, w tym tak prymitywnym jak obiekt lub dwa lub
trzy i czynność. Ma to związek zarówno z ewolucją języka
jak i jego nauką - dwie strony tej samej monety.
Implementując najczęściej używa się WordNet - wyrazy pogrupowane
w rzeczowniki, czasowniki, przymiotniki i przysłówki, plus odrobinę
informacji o wiązaniu gramatycznym, co pośrednio oddaje część
prymitywnej semantyki (obiekt, dwa lub trzy). Uczenie się
świata na podstawie pierwszych obiektów ("maaama: pilkaaa")
zajęłoby za długo. Uczenie się gramatyki prawdopodobnie też.
WordNet plus kilka reguł gramatycznych pozwala na rozbiór
gramatyczny zdania, od dawna.
Watson używa WordNet, a do semantyki ontologii, jeżeli od pewnego
momentu potrafi z języka pisanego rozbudowywać własne (doczytam
linki w wiki) to te pierwsze plus ustrukturyzowa wiedza
dają w swoistym sensie bootstrap.
--
Edek
Następne wpisy z tego wątku
- 18.02.13 14:22 Edek Pienkowski
- 18.02.13 15:02 Edek Pienkowski
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-07-01 W-wa naklejki wjazd do centrum
- 2024-07-01 ładowarka zmarła
- 2024-07-01 Koder szuka pracy. Koduję w j.: Asembler, C, C++ (z Qt) i D.
- 2024-07-01 Kraków => Kierownik Działu Spedycji Międzynarodowej <=
- 2024-07-01 Białystok => Full Stack Web Developer (.Net Core, Angular6+) <=
- 2024-07-01 Berlin => Technical Rollouter (Radio Systems Software Installation and
- 2024-07-01 Warszawa => Key Account Manager <=
- 2024-07-01 Gdańsk => Programista Full Stack .Net <=
- 2024-07-01 Zabrze => Junior HelpDesk <=
- 2024-07-01 Warszawa => Key Account Manager <=
- 2024-07-01 Bielsko-Biała => Expert Migration Architect (Azure) <=
- 2024-07-01 Mini Netykieta polskich grup dyskusyjnych
- 2024-07-01 Re: Jak wypełnić polecenie francuskiego sądu blokowania niektórych zapytań DNS? Blokując Francję
- 2024-07-01 Re: Powtórne wezwanie na PO-komisję uzdrowi Ziobrę już w 10 dni
- 2024-07-01 CA -- problem z logowaniem