マガジンのカバー画像

ポーカーAI開発シリーズ

11
UnityとMl-agentsを用いたポーカーAI開発の記録をまとめたマガジンです。月1~3本程度投稿しています。 ポーカーについて興味ある人、AIについて興味ある人を対象に、試…
運営しているクリエイター

#Unity

ポーカーAI開発 part9 ~自作した簡易GTOモデル開発の途中経過~

こんにちは!ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。前回 part8 Dee…

ポーカーAI開発 part1 〜自分と対戦して賢くなるAIを作ってみた〜

こんにちは!ナガメ研究所です。 先日、TwitterにAIと対戦した動画を投稿しました。まだ見てな…

ポーカーAI開発 part2 〜AIの行動を分析してみる〜

こんにちは!ナガメ研究所です。前回のpart1に”スキ”をくれた皆様、ありがとうございます。…

ポーカーAI開発 part3 〜AIがポーカーを実況・解説する第一歩〜

こんにちは!ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。 今回は、ポー…

ポーカーAI開発 part4 〜スタッツを元に報酬を設計する~

こんにちは!ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。 今回は、part2…

ポーカーAI開発 part6 ~17万試合を学習したAIと対戦してみた~

こんにちは!ナガメ研究所です。ポーカーAI開発の記事もpart6になりました。これまでの記事へ…

ポーカーAI開発 part7 ~スタッツを報酬に加えてうまくいった話~

こんにちは!ナガメ研究所です。人を楽しませるポーカーAIの開発をしています。今回は、前に書いたpart4の記事の続編です。よろしくお願いします。 はじめに前回、WTSDという、ポーカーのプレイ傾向を指す指標を元に、AIの学習をコントロールできないか試しました。結果は芳しくないとまとめましたが、今回は手応えを感じたのでその続編です。AIの学習方法やこれまで何をしてきたかなどの細かい話は前回の記事をぜひご覧ください。 WTSDを報酬に加えた前回のアプローチとの相違点注意!この