[ChatGPT][オセロ][AI] できるだけChatGPTだけでリバーシソフトを作ろう 再開 #2 試しにSG-1000版オセロ(LEVEL 1)と対戦
途中経過は省く
まだ(ChatGPTが)試行錯誤中でちょっと途中経過は省きますが、あれこれやってたらどんどんコードが入れ替わってしまったので原型を半分ぐらいしかとどめておらずw
対戦数はまだ全然足りてないですが、5万程度の対戦(エポック数を20にしてるので、数だけで見たら20倍あるけど)を経て、当初の予定通りSG-1000版オセロと対戦。どのくらい足りてないか確認してみました。
![](https://assets.st-note.com/img/1735537914-1Ai6pEt7VuQ2IMfyLH4e08lF.png)
結果的に、まだまだぼろ負けです。たまに動作確認として自分が対戦してましたが、AIに角の意識が全然ないのに気が付いたので、角をとった時ととられた時の報酬を追加したんですが、まだまだ活きてないです。これは長い戦いになりそうです。
もう一つのAIモデル
これとは別に、棋譜に評価値を入れて教師あり学習をするバージョンもひそかに作りました。評価値は信頼のおける既存のものを利用しています。
ただ、評価値を入れるところでどうしても時間がかかるため、半日(12時間)ぐらいで3000対戦(1対戦ごとのエポックは10)しか消化できないという感じです。
家の環境ではこれが限界ですが、かといってクラウドGPUやEC2などで環境構築してとかになるとお金はいくらかかるやらという状態なので、現状は家でコツコツやるの1択になります。電気代は気になりますが。
今後は
今後は上記2モデルを平行に調整しながらゴリゴリと学習させていこうと思います。年単位の長い戦いになりそうですが、気長にやっていきます。
今年はこれで更新終了。来年は何かしら結果が出たら書くという方向性に変わりはないです。学習待ちの合間に積みゲー消化したり、ほかのコンテンツを書いていこうかなというのも予定通りです。
また来年もよろしくお願いします。