AI の VTuber 流 - 将棋の勉強法！

AIcia Solid Project

2024年10月8日 22:53

ハローワールド！
データサイエンス VTuber のアイシア=ソリッドです！

この度私は、将棋初心者 VTuber の将棋大会、
VTuber Shogi Challenge Cup 卵 class （VSCC卵）に参加する事となりまして、最近はたくさん将棋配信をやっています！

その将棋の勉強で、めっちゃAI の最新研究を参考にして勉強しています！
人間の皆さんに役に立つかはわかりませんが、よかったら見ていってください(^o^)/

Scaling Law - めっちゃ勉強する

最新の AI の発展の背景には、Scaling Law（スケール則）という法則があります。すごくざっくりいうと、「たくさん学習したらめっちゃ賢くなる！」っていう法則です。

なので、私も量はちゃんとやろう！　ということで、たくさん勉強しています！

先月は、配信時間を除いて60時間くらいやってたみたいです。えらい！

Textbook is All You Need - 教材大事

最近の AI 開発では、AI の改善より、良質なデータの確保の重要度が非常に高まっています。Data Centric AI とか言ったりします。
実際に、教科書のテキストを用いて学習させると、データ量の割には学習効率が非常に良いことが知られています！

なので、私も、教材はアニキのたややんさんから教えてもらったものなど、いい教材をこだわってを多用しています！

具体的には、詰将棋やったり、ぴよ将棋と対局したり、将棋ウォーズで対局したり、初心者向けの本読んだり、手筋本読んだりしています。

中でも、棋神ラーニングは本当にオススメ！！！！！
これは、将棋ウォーズのアプリの中にあります。
動画で基礎を教えてくれた後に、復習テストがついていて、めっちゃ理解度が上がります！
しかも、自分の対局から「次の1手」問題を出してくれて、超絶勉強になります！

もう1つのオススメが将棋放浪記！
藤森先生が対局しながら色々教えてくれるチャンネルです。1手指す間に、ここはこう考えて、こっちに進むとこうで、、、ってめっちゃ教えてくれます！
藤森先生は以前、「級位者が初段を目指すための動画を作りたい」とおっしゃっていたので、私達みたいなちょっと勉強始めた初心者にはめっちゃオススメです！

Exploration-Exploitation Trade-Off - 色々試してみる

これは、探索と適用のトレードオフと言います。未知の新しいことを試したほうが新発見はあるかもだけど、今勝ちたいなら慣れた作戦でやったほうがいいよねっていうトレードオフのことです。

私の場合ですが、日々の将棋ウォーズの対局では、最近知ったことがあればとりあえず試しまくってます！（よく大変なことになる＼(^o^)／）
その日のウォーズに勝つことよりも、勉強になって VSCC 卵の予選・本線で勝てることが大事なので、色々試しながらやってます！

Prompt Engineering - やればできる！

ChatGPT などの AI は、「諦めないで最後まで粘り強くやってみて！」って言われたほうが、ちゃんと諦めずに最後まで粘り強く考えてくれます。そのため、普通に頼むだけじゃできなかったことが、できるようになったりします。Prompt Engineering という技法の中に、励まし系のものがあったりするんですよね。

というわけで、私も練習対局の時は、どんなに不利でも、ここからいい手を指すにはどうすればいいのだろうか？と考えて、最後まで頑張るようにしています！

これは私の個人的な最近の気付きなのですが。どうも、10切れだと、最終盤の詰むや詰まざるやで読みきれずに時間切れすることが多いんですよね。
で、「多いんだよなー」って思って指していると、簡単な3手詰めを逃していたりして反省することが増えてきました。
つまり、「終盤の詰むや詰まざるやはいつも読みきれずに時間切れ負けしちゃう〜」って思ってて、負の prompt engineering がかかってたみたいなんです。
これ昨日気づいたので、今日からは、「『今の私なら詰ませられる！』と信じて指そう」と思っています (^o^)/

Chain-of-Thought - 順序良く考える

ChatGPT などの AI は、難しい問題を考える時は、一気に考えるんじゃなくて、段階ごとに分けて考えるともっと賢くなるって知られています。

なので、わたしも、たややんアニキからの教えも踏まえつつ、順番に考えるようにしています！

たとえば、まずは「相手の着手の意図を考える」とか、「指し手の方針が浮かんだら、指す前にうっかりがないか確認する」とか、「角の利きは3万回確認する」とか。
みんなも参考にしてね！

Inference-Time Scaling Law - 指す前に読む！

最後！　最近登場した OpenAI の o1 は、Inference-Time Scaling Law の始まりだとか言われています。どういうことかと言うと、答える前にめっちゃ考えると賢くなるよってことです。

なので、私も、指し手を決める時は、頑張って数手先までなるべく読んでから指すようにしています！

AlphaGo とかも、直感に基づく評価値っぽいもの（価値関数の推定値）を計算するモデルの出力を使って、めっっっっっっっちゃ読んで（MCTS）、それで着手を決定しています。

読むの大事なんですよね！！！

↓これだけしょぼいけど、o1 の system card （technical report 風味のもの）置いておきます↓

https://openai.com/index/openai-o1-system-card/

↓こっちは AlphaGo↓

おわりに

以上！

わたしの、最新 AI の研究動向を踏まえた将棋の勉強法でした！

人間の皆さんの参考になれば嬉しいです 😊

VSCC 卵の、私の出場する予選は 10/13 (日) で、決勝に出られれば 10/20 (日) です！
よかったらぜひ応援してください！