-
Data: 2017-12-29 05:47:19
Temat: Re: AlphaZero
Od: "M.M." <m...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On Wednesday, December 27, 2017 at 8:57:32 AM UTC+1, M.M. wrote:
> On Wednesday, December 27, 2017 at 8:54:32 AM UTC+1, M.M. wrote:
> > On Wednesday, December 27, 2017 at 8:01:36 AM UTC+1, M.M. wrote:
> > > On Sunday, December 24, 2017 at 5:31:59 PM UTC+1, grapeli23 wrote:
> > > > [...]
> > > > Co z tego że biedzisz się nad silnikiem szachowym. Jak googlowe AI po
> > > > zaprzęgnięciu sporej ilości TPU na 5h bije najlepszy silnik szachowy
> > > > Stockfish po tak krótkim treningu.
> > >
> > > Tematyka programowania szachów kiedyś bardzo mnie interesowała,
> > > postanowiłem więc założyć powyższym cytatem specjalny wątek - wątpię, ale
> > > może się rozwinie.
> > >
> > > Najpierw link
> > > https://chessprogramming.wikispaces.com/AlphaZero
> > >
> > > Wynika z tego, że AlphaZero wygrywa także w szachy i to z dobrymi
> > > programami komputerowymi choć warunki gry wzbudzały jakieś
> > > kontrowersje.
> > >
> > >
> > > Pozdrawiam
> >
> > Na szybko wygooglane kontrowersje:
> >
> > http://www.talkchess.com/forum/viewtopic.php?topic_v
iew=threads&p=745180&t=66121
> >
> > Pozdrawiam
>
> Sorki że na raty, tutaj też ciekawe:
>
> http://www.talkchess.com/forum/viewtopic.php?topic_v
iew=threads&p=743977&t=66062
>
> Pozdrawiam
I co koledzy, koleżanki? Czyżbym miał niestety rację, że nikt się nie
wypowie? Na pewno zagląda tutaj niejedna osoba mogąca coś interesującego
powiedzieć o programowaniu gier dwuosobowych, o sztucznych sieciach
neuronowych, o uczeniu maszynowym, o TPU i w ogóle o googlowej platformie
do maszynowego uczenia. Można u googla nawet dostać 300USD do wydania
na tej platformie, ale przy rejestracji numer karty trzeba podać.
Wracając do AlphaZero. Program (rzekomo) począwszy od losowego stanu, w ciągu
zaledwie czterech godzin uczenia, osiągnął poziom najlepszego programu
szachowego, a nawet go pokonał w meczu składającym się ze 100 gier. AlphaZero
żadnej gry nie przegrał, większość gier zremisował i niecałe 30 gier wygrał.
Krótki czas uczenia nie imponuje mi. Osobiście, gdy używałem liniowego neuronu,
to szybkie uczenie być może nawet było moim problemem. Mój program, po 2-4
dobach uczenia liniowego neuronu na jednym komputerze, osiągał swoje maksimum
Po dłuższym uczeniu grał gorzej. Imponuje mi to, że udało im się osiągnąć
wysoką jakość gry w oparciu o dużą siec neuronową. Gdy ja próbowałem uczyć
większe sieci, to raczej nie odnosiłem żadnych sukcesów.
Co Wy na to wszystko?
Pozdrawiam
Następne wpisy z tego wątku
- 29.12.17 15:03 fir
- 29.12.17 15:08 fir
- 29.12.17 19:11 Roman Tyczka
- 29.12.17 20:12 fir
- 29.12.17 20:17 fir
- 29.12.17 20:49 AK
- 29.12.17 22:14 fir
- 29.12.17 22:20 slawek
- 29.12.17 22:20 fir
- 29.12.17 22:33 fir
- 29.12.17 22:33 AK
- 30.12.17 11:52 M.M.
- 30.12.17 16:41 fir
- 31.12.17 09:40 M.M.
- 01.01.18 20:01 slawek
Najnowsze wątki z tej grupy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
- TCL - problem z escape ostatniego \ w nawiasach {}
- Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- testy-wyd-sort - Podsumowanie
- Tworzenie Programów Nieuprzywilejowanych Opartych Na Wtyczkach
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
Najnowsze wątki
- 2025-02-12 Warszawa => Expert Recruiter 360 <=
- 2025-02-12 Ostrów Wielkopolski => Area Sales Manager OZE <=
- 2025-02-12 Bieruń => Regionalny Kierownik Sprzedaży (OZE) <=
- 2025-02-12 Dęblin => Node.js / Fullstack Developer <=
- 2025-02-12 Kraków => PHP Full Stack Developer <=
- 2025-02-12 Karta dźwiękowa stereo
- 2025-02-12 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-02-12 Gdańsk => Specjalista ds. Sprzedaży <=
- 2025-02-12 Łódź => NodeJS Developer <=
- 2025-02-12 Błonie => Sales Specialist <=
- 2025-02-12 Dziwne zachowanie magistrali adresowej w 8085
- 2025-02-11 Mini pecet
- 2025-02-10 Spalił się spaliniak
- 2025-02-10 zarowka wifi - z sensowna apka lub lepiej albo lokalnie lub przez web. I zeby harmonogram miala
- 2025-02-10 Chrzanów => Programista NodeJS <=