TKK | Tietoverkkolaboratorio

Ristinolla - Tic Tac Toe

About the Game

The computer player uses simple policy. It counts how many symbols are missing from 5 symbol long vector and assigns a value for each empty square based on that (0-9). Needless to say it's easy to beat the computer.

Iteration: In first policy iteration each possible action is evaluated by playing the game until end using the standard policy for further moves (both sides). The best initial action is then chosen based on the result of these games.

The resulting policy is never worse than the original, and in practice policy iteration converges often quickly to the optimum.

Back to java demos page.


Tietoverkkolaboratorio on nyt osa Tietoliikenne- ja tietoverkkotekniikan laitosta. Tällä sivulla oleva tieto voi olla vanhentunutta.

Tämän sivun sisällöstä vastaavat Esa Hyytia ja Webmaster.
Sivua on viimeksi päivitetty 19.09.2007 18:05.
URI: http://www.netlab.tkk.fi/~esa/java/risti/index.shtml
[ TKK > Sähkö- ja tietoliikennetekniikan osasto > Tietoverkkolaboratorio ]