eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programminggry z niepełną informacją i montecarloRe: gry z niepełną informacją i montecarlo
  • Path: news-archive.icm.edu.pl!news.gazeta.pl!not-for-mail
    From: " M.M." <m...@g...pl>
    Newsgroups: pl.comp.programming
    Subject: Re: gry z niepełną informacją i montecarlo
    Date: Wed, 9 May 2012 13:14:58 +0000 (UTC)
    Organization: "Portal Gazeta.pl -> http://www.gazeta.pl"
    Lines: 78
    Message-ID: <jodqki$6hn$1@inews.gazeta.pl>
    References: <joc2ie$hj0$1@inews.gazeta.pl>
    <85823.1664.1336550934907.JavaMail.geo-discussion-forums@vbq19>
    <jodf3t$875$1@inews.gazeta.pl> <jodjce$4bq$6@inews.gazeta.pl>
    NNTP-Posting-Host: localhost
    Content-Type: text/plain; charset=ISO-8859-2
    Content-Transfer-Encoding: 8bit
    X-Trace: inews.gazeta.pl 1336569298 6711 172.20.26.241 (9 May 2012 13:14:58 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Wed, 9 May 2012 13:14:58 +0000 (UTC)
    X-User: mariotti
    X-Forwarded-For: 89.229.34.123
    X-Remote-IP: localhost
    Xref: news-archive.icm.edu.pl pl.comp.programming:197147
    [ ukryj nagłówki ]

    Edek Pienkowski <e...@g...com> napisał(a):

    > Dnia Wed, 09 May 2012 09:58:21 +0000, M.M. napisal:
    >
    > > Roman W <b...@g...pl> napisał(a):
    > >
    > >> Podobne problemy czesto rozwiazuje sie w matematyce finansowej. Jezeli
    > >> zalozysz, ze gra trwa maksymalnie N ruchow (to chyba jest prawda dla
    > >> tysiaca?), to drzewko gry mozesz po prostu przejsc od konca. To powinno
    > >> uwzglednic blefy.
    > >> Poczytaj o metodach wyceny opcji amerykanskich na drzewach i metoda "least
    > >> squares Monte Carlo".
    > >
    > > Może gra w tysiąca do wyrobienia sobie wstępnego poglądu jest nadal zbyt
    > > rozbudowana. Może powinienem posłużyć się jakąś prostszą grą. Z kole
    > i
    > > nie wiem czy prostszej grze stosowanie blefów będzie miał jakikolwiek
    > > sens...
    > >
    > > MoĹźe taka gra:
    > [...]
    > >
    > > Jak powinien wyglądać algorytm który nigdy nie przegra w taką grę?
    > > Interesuje mnie taki algorytm wraz z dowodem matematycznym Ĺźe jest
    > > algorytmem optymalnym.
    >
    > Tit-for-tat przeradza się w tit-for-tat-if-cannot-abuse-opponent.
    > W psychologii trudno o dowody formalne.

    Zróbmy coś, aby wyeliminować psychologię :)

    Można to rozpatrywać w postaci dwuwymiarowej tabeli. W poziomie i
    w pionie mamy kolejne programy, a w komórce na skrzyżowaniu
    wiersza x z kolumną y mamy wynik jaki uzyskuje program x grając
    przeciwko programowi y. Jeśli w komórce jest 100% to znaczy
    że x wygra wszystkie gry bez względu na to jak zostały rozdane
    karty.

    Moje pierwsze pytanie chyba można sprowadzić do tego, czy dla danej
    gry istnieje program który ma minimalną wartość 50% ( minimalną, czyli
    obojętnie z jakim programem zagra, to uzyskuje 50% lub więcej.).

    W różnych grach czynnik blefu może mieć różne skutki. Nie wiem w
    tej chwili czy są gry z niepełną informacją w których czynnik blefu
    nigdy nie poprawi wyniku. Jeśli takie gry są, to w nich należy grać
    optymalnie i należy zakładać że przeciwnik zagra/zagrał optymalnie.
    Myślę że dla takich gier istnieją programy które minimalną wartość w
    powyższej tabeli będą miały właśnie 50%.

    Natomiast dla gier w których blefowanie może pomóc taki algorytm
    raczej nie istnieje. Chyba dla każdej strategii blefowania
    można napisać taką strategię która osiągnie ponad 50%.

    Dobrze myślę czy źle?

    Ponadto rodzą się kolejne problemy.

    Po pierwsze jak ocenić czy w danej grze czynnik blefu ma duże znaczenie czy
    małe? A jeśli już ocenimy jakie ma znaczenie, to jak wpleść w
    algorytm choćby jakieś najprostsze szacowanie sposobu blefowania przeciwnika?

    W grach karcianych gdy jest już po rozgrywce to dowiadujemy się jakie
    karty otrzymał przeciwnik. Pamiętamy także jak dokładał karty. Może należy
    zawsze grać optymalnie, a blef oceniać tylko u przeciwnika? Można obliczyć
    jak odległa była strategia obrana przez przeciwnika od strategii
    optymalnej i zakładać jakąś średnią ważoną z N ostatnich rozdań?

    Wydaje się sensowne jeśli program całkowicie zaniecha blefowania a będzie
    grał zawsze optymalnie. Jeśli program zdoła oszacować poziom blefowania
    przeciwnika (a tym samym poziom umiejętności gry przeciwnika) to zagra
    optymalnie do oszacowanego poziomu.


    Pozdrawiam


    --
    Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: