-
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
atman.pl!.POSTED!not-for-mail
From: Edek Pienkowski <e...@g...com>
Newsgroups: pl.comp.programming
Subject: Re: Ciekawy program...
Date: Mon, 18 Feb 2013 12:39:04 +0000 (UTC)
Organization: ATMAN - ATM S.A.
Lines: 53
Message-ID: <kft7d8$c2h$1@node2.news.atman.pl>
References: <552r54uih227$.1sjw2dke9nhql.dlg@40tude.net>
<3...@g...com>
<k...@4...net>
<0...@g...com>
<kfbok8$nad$1@mx1.internetia.pl>
<1...@g...com>
<kfbvf0$mdr$2@somewhere.invalid>
<4...@g...com>
<kfo51r$kik$2@node1.news.atman.pl>
<b...@g...com>
<kfs14f$9tk$1@node2.news.atman.pl>
<2...@g...com>
<kfs3ut$bm0$1@node2.news.atman.pl>
<4...@g...com>
NNTP-Posting-Host: 77-255-207-227.adsl.inetia.pl
Mime-Version: 1.0
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: 8bit
X-Trace: node2.news.atman.pl 1361191144 12369 77.255.207.227 (18 Feb 2013 12:39:04
GMT)
X-Complaints-To: u...@a...pl
NNTP-Posting-Date: Mon, 18 Feb 2013 12:39:04 +0000 (UTC)
User-Agent: Pan/0.139 (Sexual Chocolate; GIT bf56508 git://git.gnome.org/pan2)
Xref: news-archive.icm.edu.pl pl.comp.programming:202079
[ ukryj nagłówki ]Dnia Sun, 17 Feb 2013 20:06:01 -0800, M.M. wyszeptal:
> W dniu poniedziałek, 18 lutego 2013 03:34:05 UTC+1 użytkownik Edek Pienkowski
napisał:
>> Dnia Sun, 17 Feb 2013 18:18:01 -0800, M.M. wyszeptal:
>> >> Wyszłoby to co opisałeś: miałbyś statystykę, który wyraz
>> >> występuje częściej po innym wyrazie niż inny. Do
>> >> uczenia gramatyki jest daleko, od semantyki dzieli przepaść.
>> > Niestety to prawda.
>
>> Prawda: to znaczy co jest prawdą?
> Prawdą jest że do uczenia gramatyki/semantyki pozostał przepaść.
> Niemniej z czystej ciekawości chciałbym zobaczyć jak się
> uczy taki prosty program.
Nie uczy się tego akurat najczęściej, bo reguły gramatyczne
są znane i proste do zahardkodowania.
>> Metody probabilistyczne
>> jak najbardziej działają, tyle że to był trywialny przykład.
>> Lepszym modelem uczenia struktury są hidden markov chains.
> Na czym polega ta technika tak na chłopski rozum? Strzelam: rzutuje
> się frazy na jakieś stany i potem prawdopodobieństwo że wyraz
> xxx tłumaczy się jako yyy jeśli poprzednie stany były sss ?
Reprezentuje takie reguły jak to, że w języku angielskim
czasownik po czasowniku oznacza a) formę gramatyczną, b)
jak w większości języków jeden z czasowników jest czynnością
będącą obiektem drugiej czynności: "przestał ciągnąć Jasia za
nogę" c) koljeny czasownik ropoczyna kolejne zdanie podrzędne.
Raczej nie technika, a wynik badań kilkulatków. Sam model
nie załatwia wszystkiego - język jest bardzo mocno powiązany
ze znaczeniem, w tym tak prymitywnym jak obiekt lub dwa lub
trzy i czynność. Ma to związek zarówno z ewolucją języka
jak i jego nauką - dwie strony tej samej monety.
Implementując najczęściej używa się WordNet - wyrazy pogrupowane
w rzeczowniki, czasowniki, przymiotniki i przysłówki, plus odrobinę
informacji o wiązaniu gramatycznym, co pośrednio oddaje część
prymitywnej semantyki (obiekt, dwa lub trzy). Uczenie się
świata na podstawie pierwszych obiektów ("maaama: pilkaaa")
zajęłoby za długo. Uczenie się gramatyki prawdopodobnie też.
WordNet plus kilka reguł gramatycznych pozwala na rozbiór
gramatyczny zdania, od dawna.
Watson używa WordNet, a do semantyki ontologii, jeżeli od pewnego
momentu potrafi z języka pisanego rozbudowywać własne (doczytam
linki w wiki) to te pierwsze plus ustrukturyzowa wiedza
dają w swoistym sensie bootstrap.
--
Edek
Następne wpisy z tego wątku
- 18.02.13 14:22 Edek Pienkowski
- 18.02.13 15:02 Edek Pienkowski
Najnowsze wątki z tej grupy
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
Najnowsze wątki
- 2024-12-21 Żerniki => Specjalista ds. Employer Brandingu <=
- 2024-12-21 jak tacy debile
- 2024-12-20 Precedensy politycznie motywowanego nie wydawania w UE
- 2024-12-20 Obrońcy
- 2024-12-20 Obrońcy
- 2024-12-20 Obrońcy
- 2024-12-20 Gdańsk => Inżynier bezpieczeństwa aplikacji <=
- 2024-12-20 czyste powietrze
- 2024-12-20 Katowice => Analyst in the Trade Development department (experience wi
- 2024-12-20 Opole => Inżynier Serwisu Sprzętu Medycznego <=
- 2024-12-20 Katowice => Regionalny Kierownik Sprzedaży (OZE) <=
- 2024-12-20 Rzeszów => International Freight Forwarder <=
- 2024-12-20 Katowice => Key Account Manager (ERP) <=
- 2024-12-20 Ekstradycja
- 2024-12-20 Mikroskop 3D