Paoの技術力を磨くブログ

機械学習やブロックチェーン等の技術を身に付けていくブログです。

Chainerrl

深層強化学習を用いた一人麻雀AIを作ってみた

最近はブロックチェーンまわりばかりだったが、 前々からやっていた麻雀AIの強化学習について一旦まとめておく。 麻雀好きの人から機械学習興味ある人まで読めるよう書いたみたけど、どうでもいいとこは飛ばしながら、分からないとこあれば気軽にコメントく…

【深層強化学習】Chainerrlのa3cのモデル定義で入力チャネル数でNoneは使わないこと

急にテーマが代わり、強化学習の話。 しかも、かなりニッチな話。 深層強化学習のライブラリとして「Chainrrl」を使っている。 「Chainrrl」はPreferred Networksが提供しているChainerを使った深層強化学習ライブラリ。 新しい手法とかも実装されているので…