-
11. Data: 2012-05-10 08:02:36
Temat: Re: gry z niepełną informacją i montecarlo
Od: Paweł Kierski <n...@p...net>
W dniu 2012-05-09 15:14, M.M. pisze:
[...]
> W grach karcianych gdy jest już po rozgrywce to dowiadujemy się jakie
> karty otrzymał przeciwnik. Pamiętamy także jak dokładał karty. Może należy
> zawsze grać optymalnie, a blef oceniać tylko u przeciwnika? Można obliczyć
> jak odległa była strategia obrana przez przeciwnika od strategii
> optymalnej i zakładać jakąś średnią ważoną z N ostatnich rozdań?
To też tylko przybliżenie. Czytałem wywiad z zawodowym pokerzystą -
grają czasem z pewnym poziomem blefowania przez część sezonu tylko po
to, żeby w ważnym turnieju zagrać inaczej (blefować bardziej lub
mniej). Czyli oszukać takie strategie - zakładając jakieś N
u przeciwników. Oczywiście można wymyślić kolejną meta-strategię:
przez M sezonów gramy z ustalonym N (zmiana blefu w tym samym czasie),
żeby po M sezonach zmienić inaczej.
--
Paweł Kierski
n...@p...net
-
12. Data: 2012-05-10 08:33:48
Temat: Re: gry z niepełną informacją i montecarlo
Od: voy <v...@M...pl>
W dniu 2012-05-09 18:43, Edek Pienkowski pisze:
>
> Są gry, gdzie blef jest czasem stricte opłacalny, ale częściej to
> zależy od przeciwnika. Blef to w końcu blef. Można robić dwa rodzaje
> założeń: takie, że przeciwnik zawsze zachowa się racjonalnie,
> to znaczy zgodnie z najlepszą strategią - tą optymalną - albo
> takie, że nie każdy przeciwnik zachowa się racjonalnie, w tym sensie,
> że jego strategia nie jest optymalna. I dochodzimy do tit-for-tat.
> Socjologia nie przewiduje, że każdy będzie się przewidywał racjonalnie
> i stosuje się to przez model gry (chociaż nie zawsze trzeba wygrać,
> to są pożądane skutki i niepożądane, to czasem tłumaczy dlaczego
> ludzie stoją w kolejce czy w korku, chociaż mogliby wybrać inny moment,
> a jednak wszyscy tę kolejkę tworzą). Nieracjonalność nie bierze
> się koniecznie z robienia sobie na złość, może wynikać z braku
> informacji lub nieuwzględnienia strategii optymalnej. W tit-for-tat
> racjonalne jest pomaganie przeciwnikowi o ile on pomaga tobie. Ale,
> optymalniejsze jest wrabianie przeciwnika w pomaganie tobie, chyba
> że się nie da, bo przeciwnik jest - no właśnie - bardziej racjonalny
> i uwzględnia to, że można się wrabiać.
>
> Blef może być czasami optymalny sam w sobie, ale jak nie jest to
> widzę te same problemy.
>
> Edek
Może to Was jeszcze zainteresuje (Dylemat więźnia):
http://pl.wikipedia.org/wiki/Dylemat_wi%C4%99%C5%BAn
ia
Pozdr :)
-
13. Data: 2012-05-15 17:36:46
Temat: Re: gry z niepełną informacją i montecarlo
Od: " M.M." <m...@g...pl>
Edek Pienkowski <e...@g...com> napisał(a):
> No to ryzyk fizyk, poszedłem i kupiłem bilet.
Wybrałeś coś w okolicach zachowania optymalnego. Stojąc w kolejce i tak i
tak byś nie zdążył. Każdy inny ruch może okazać się lepszy, choćby
zapytanie przypadkowej osoby czy rozmyśliła się z podróży i odsprzeda bilet.
> Co prawda irracjonalny umysł
> mówi mi, że z tą kasą coś jest nie tak, wszyscy stoją na środku, miliony
> much itd. No ale nie wiem, bilet ok, reszta ok, babka nie pluła mówiąc a i
> tak była szyba ;)
> Wracałem obok kolejki, jakieś dwie z tapetą pytają czy tamta kasa czynna i
> w bieg, ale same by dupy nie ruszyły, w końcu wszyscy tu stoją. Ok,
> pomyślałem, pewnie tamtą kasę właśnie otworzyli czy właśnie mieli zamknąć i
> stąd taka anomalia.
Przez taki przykład pięknie docieramy do analizy działania ludzkiego umysłu.
Na jakiej zasadzie on podejmuje decyzje?
Jakiś czas temu grałem w karty. Słabo mi szło i przegrywałem. Przegrywałem
za sprawą tego, iż swoją uwagę podzieliłem po połowie. Jedna połówka mojej
jaźni (czy tam czegoś innego) analizowała grę i starała się wygrywać. Druga
połówka starała się obserwować co robi pierwsza i odgadnąć czemu ona
zawdzięcza swoją skuteczność (choćby ta skuteczność nie była porażająca ;)
A może nie było żadnych połówek, tylko całość co krótką chwilę się
przełączała z jednego zadania na drugie - nie wiem. W każdym razie trochę
jakiś bliżej nieokreślonych i subiektywnych odczuć pozostało w mojej pamięci.
Krótko po tym tak się złożyło że miałem dużo wolnego czasu. Mogłem
komfortowo oddać się rozmyślaniom. Starałem się znaleźć związek pomiędzy
powyższymi wspomnieniami a algorytmem. Być może to był mój błąd, ale
tym razem już nie dzieliłem uwagi po połowie lecz w całości oddawałem się
rozmyślaniom. Nagle nie wiedząc dlaczego w mojej wyobraźni zarysował się
pomysł na adaptację algorytmu MC do gry z pełną informacją (typu szachy,
warcaby czyli do zgoła innej gry niż gry karciane). Nigdy wcześniej o
takim pomyśle nie czytałem, nigdy nie słyszałem, nigdy nie widziałem
programu który by używał czegoś podobnego.
Jaki to algorytm jest w ludzkim umyśle że umożliwia mu zagranie w karty,
zakup biletu w kasie, wymyślenie algorytmu, a może także umożliwi mu
kiedyś odkrycie algorytmu wg jakiego działa on sam?
> Ale wczoraj było deja vu - nikt do tej kasy nie podejdzie,
> bo wszyscy stoją do tej głównej grupy kas na środku i nikt się nie ruszy.
> Nawet chyba widzą tą kasę, ale stoją karnie. Albo z tą kasą faktycznie
> jest coś nie tak, albo coś, tak twierdzi mój irracjonalny umysł, ale
> racjonalnie podchodzę i kupuję bilet bez kolejki. Stanie w kolejkach to
> dzisiaj jakiś fetysz? ;)
Nieważne. Bardziej mnie zastanawia jaki algorytm umożliwił mojemu umysłowi
znalezienie w krótkiej chwili 10 mniej lub bardziej prawdopodobnych
wyjaśnień.
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
14. Data: 2012-05-15 18:01:43
Temat: Re: gry z niepełną informacją i montecarlo
Od: Edek Pienkowski <e...@g...com>
Dnia Tue, 15 May 2012 15:36:46 +0000, M.M. napisal:
> Edek Pienkowski <e...@g...com> napisał(a):
>
> Jaki to algorytm jest w ludzkim umyśle że umożliwia mu zagranie w karty,
> zakup biletu w kasie, wymyślenie algorytmu, a może także umożliwi mu
> kiedyś odkrycie algorytmu wg jakiego działa on sam?
To nic nowego. Psychologowie od dawna eksperymentują w ten sposób na sobie
- obserwując samego siebie - i (o zgrozo ;) ) na swoich dzieciach.
[...to co nieważne...]
> Nieważne. Bardziej mnie zastanawia jaki algorytm umożliwił mojemu umysłowi
> znalezienie w krótkiej chwili 10 mniej lub bardziej prawdopodobnych
> wyjaśnień.
To musisz jeszcze popracować może nie tyle nad eliminacją tych mniej
prawdopodobnych ale chociaż nad faktem, dlaczego jedna nie dominuje. W końcu
robiąc ruch ręką robisz jeden ruch a nie 10 jednocześnie.
Edek
-
15. Data: 2012-05-15 19:31:58
Temat: Re: gry z niepełną informacją i montecarlo
Od: " M.M." <m...@g...pl>
Edek Pienkowski <e...@g...com> napisał(a):
> Dnia Tue, 15 May 2012 15:36:46 +0000, M.M. napisal:
>
> > Edek Pienkowski <e...@g...com> napisaĹ(a):
> >
> > Jaki to algorytm jest w ludzkim umyĹle Ĺźe umoĹźliwia mu zagranie w karty,
> > zakup biletu w kasie, wymyĹlenie algorytmu, a moĹźe takĹźe umoĹźliwi mu
> > kiedyĹ odkrycie algorytmu wg jakiego dziaĹa on sam?
>
> To nic nowego. Psychologowie od dawna eksperymentujÄ w ten sposĂłb na sobie
> - obserwujÄ c samego siebie - i (o zgrozo ;) ) na swoich dzieciach.
Nie znam się na psychologii. Może jakiś link, albo hasło do wpisania w
wyszukiwarkę? Co to za eksperymenty?
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
16. Data: 2012-05-15 20:31:27
Temat: Re: gry z niepełną informacją i montecarlo
Od: Edek Pienkowski <e...@g...com>
Dnia Tue, 15 May 2012 17:31:58 +0000, M.M. napisal:
> Edek Pienkowski <e...@g...com> napisał(a):
>
>> Dnia Tue, 15 May 2012 15:36:46 +0000, M.M. napisal:
>>
>> > Edek Pienkowski <e...@g...com> napisaĹ(a):
>> >
>> > Jaki to algorytm jest w ludzkim umyĹle Ĺźe umoĹźliwia mu zagranie w karty,
>> > zakup biletu w kasie, wymyĹlenie algorytmu, a moĹźe takĹźe umoĹźliwi mu
>> > kiedyĹ odkrycie algorytmu wg jakiego dziaĹa on sam?
>>
>> To nic nowego. Psychologowie od dawna eksperymentujÄ w ten sposĂłb na sobie
>> - obserwujÄ c samego siebie - i (o zgrozo ;) ) na swoich dzieciach.
> Nie znam się na psychologii. Może jakiś link, albo hasło do wpisania w
> wyszukiwarkę? Co to za eksperymenty?
To są te najtańsze i najszybsze eksperymenty, nie trzeba zatrudniać 10
badaczy i 1000 świnek doświadczalnych: sprawdza się na sobie w 5 minut.
Nie sądzę, żeby miały nazwę. Nie wiem czy są popularne w literaturze,
mają w końcu spory błąd pomiarowy, a literatury nie znam bo to nie moja dziedzina.
Akurat czytałem gdzieś o tym, jak dzieci uczą się języka i dlatego ligwistka
kolekcjonowała wypowiedzi maleństwa zwracając uwagę na wszystkie przekręcone
z naszego punktu widzenia wypowiedzi, żeby sprawdzić jak małe uczy się języka
konstruując ze znanych już sobie konstrukcji nowe i jak później to "wygładza"
ucząc się właściwych reguł gramatycznych i innych. Oczywiście robiła też
badania na grupach osób posługujących się różnego rodzaju językami i posługiwała
się badaniami innych.
Edek
-
17. Data: 2012-05-17 14:20:01
Temat: re: gry z niepelna informacja a montecarlo
Od: " profesor fir" <f...@g...pl>
moze bym na to cos odpowiedzial (watpie bo nie
zajmuje sie tym) gdybym wiedzial czym gry z niepelna
informacja roznia sie od tych z pelna informacja
i na czym polega to rozroznienie (szachy sa z pelna?)
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
18. Data: 2012-05-17 16:20:28
Temat: Re: re: gry z niepelna informacja a montecarlo
Od: " M.M." <m...@g...SKASUJ-TO.pl>
profesor fir <f...@g...pl> napisał(a):
> moze bym na to cos odpowiedzial (watpie bo nie
> zajmuje sie tym) gdybym wiedzial czym gry z niepelna
> informacja roznia sie od tych z pelna informacja
> i na czym polega to rozroznienie (szachy sa z pelna?)
Na moje musi spełniać wszystkie z poniższych punktów aby
była grą skończoną z pełną informacją:
a) znany jest stan początkowy
b) znane są stany końcowe
c) znana jest funkcja przejść ze stanu poprzedniego do następnego ( znane
są dozwolone ruchy )
d) wiadomo kto w danym stanie ma prawo do ruch
e) w każdym stanie jest skończona ilość ruchów
f) wiadomo jaka jest funkcja wypłaty, czyli wiadomo ile każdy z graczy
otrzymuje traci po osiągnięciu każdego ze stanu końcowego.
Jeśli w grze bierze udział dokładnie dwóch zawodników to mamy grę
jak powyżej, ale jeszcze możemy o niej powiedzieć że jest grą
dwuosobową. Jeśli wartość funkcji wypłaty jednego gracza (gdy
przegrał, wygrał, zremisował, czy co tam jeszcze) jest równa wartości
funkcji wypłaty drugiego gracza ze znakiem ujemnym to mamy grę o sumie
zerowej - można łatwo (i z pewnych powodów wygodnie) pod taką definicję
podciągnąć szachy, warcaby, otello, czwórki, go i wiele innych gier
planszowych.
Jeśli esperancja prawdopodobieństw osiągnięcia stanów końcowych z
ich wypłatami jest dla obu graczy taka sama to mamy jeszcze do czynienia
z grą sprawiedliwą. Gry planszowe i karciane tylko czasami są grami
sprawiedliwymi - dlatego np. gra się raz białymi a drugi raz
czarnymi, albo rozdaje za każdym razem ktoś inny.
Gry karciane do których w tym wątku nawiązywałem pośrednio nie
spełniają punktu c. Nie wiemy jakie otrzymał karty przeciwnik i
choć wiadomo jakie są dozwolone ruchy w danym stanie to nie możemy
ruchów określić, gdyż właśnie nie mamy pełnej informacji o stanie gry
w jakim aktualnie jesteśmy - właśnie o takie gry mi chodziło.
Pozdrawiam
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
19. Data: 2012-05-17 16:52:33
Temat: Re: 'światowe' programowanie
Od: " " <f...@g...pl>
> > (w mojej pierwszej robocie - mialem fajne mieszkanie itp)
> > Ostatnimi laty chorowanie i nuda.. Czy ktos mial takie co
> > bardziej 'swiatowe' doswiadczenia i na czym to polegalo
>
> Poszukaj sobie jak wygląda siedziba Google od środka.
>
podejrzewam, szczerze mowiac, ze jest/moze byc wiele
ciekawszych miejsc gdzie latwiej o jakis dobrą przygodę
i fajny czas niz w orporacji google (trudno powiedziec bo
nie mowie np o polowaniu na niedzwiedzia z łukiem w
przerwie na obiad itp) ;-)
no to niestety nie moge nic powiedziec bo pytanie jest dosyc
specjalistyczne (bardziej to o grach w karty niz o programowaniu)
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
-
20. Data: 2012-05-17 16:55:49
Temat: Re:
Od: " " <f...@N...gazeta.pl>
(sorki, przypadkow (przez bledy gazety) skleily sie dwie odpowiedzi
na dwa rozne watki )
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/