Reinforcement Learning の self play についてのまとめ
強化学習の self play について知りたいことがあるので、ざっくりと有名な論文を読んでいく。熟読はしない。
知りたいこと
論文
- Mastering the game of Go without human knowledge +
- Mastering Chess and Shogi by Self-Play with a
General Reinforcement Learning Algorithm)
- 上記と同じっぽい
Beating the World’s Best at Super Smash Bros. Melee with Deep Reinforcement
- 6種類の違うモデルを戦わせた。過去の自分と戦わせたとの記述がある。
- game 内に内蔵されている別AIとの対戦で評価?