見出し画像

【テクノロジーの話】【将棋の話】将棋AIの進化についてのまとめ

本記事は途中まで無料で読めます。


黎明期(1970-90年代)

 序盤中盤は不安定で、終盤だけが強い

水平線効果

 このころのソフトウェアは、ある局面からN手後の局面までを全探索し、各局面の価値を評価関数を用いて評価することで、評価値の高くなる候補手を選んでいました。
 そうすると、水平線効果により、とんでもない悪手を指してしまうことがあります。
 水平線効果とは、有限深度Nで探索を打ち切ってしまうために、長期的に見て問題のある選択をしてしまうという、人工知能特有の問題です。

内藤将棋。序盤は組み込まれたデータベース通りに進む。人間がソフトの手順を見切ってトラップを仕込めば最短15手で勝てた。

 水平線効果は、「コンピュータが年々進化し、その計算能力向上を生かす」とか、「将棋の実力がより高い人が評価関数をチューニングする」という方法で改善されていきます。
 チューニングとはつまり、「無駄な手を候補から外して、有力な手に絞って深堀りする」ことで、探索深度Nが増えました。

金沢将棋。1990年代に最強を誇った将棋プログラム。開発者自身がアマチュア高段者で、効果的なチューニングが行われていた。

終盤力

 終盤では、詰め将棋専用のルーチン(=ある局面で詰みがあるかどうかの探索)が有効でした。
 探索範囲が「王手およびその対応」に限られるため、ソフトウェアにとっては得意な処理になります。

 そのため、詰将棋を解く棋力では、1968年という早い時期にアマチュア三段と認定されていました。
 週刊誌の企画で人間対コンピュータの詰将棋早解き競争が行われ、日立HITACハイタック5020は人間とほぼ互角の成績だったという記録が残っています(人間側の49勝53敗)。

HITAC5020。国産初の大型機で、IBM 7090並みのスペックを持つ。クロック周波数は0.5MHz。

発展期(2000年代~2015年)

 自分の弱さを認め、強い人をパクって強くなった

機械学習の登場

 2000年代、Bonanzaの成功により、機械学習がブレイクスルーとして脚光を浴びるようになりました。
 細かく言えば、「学習済みデータを教材とした教師あり学習(プログラムが教師の手を最善手として選ぶようにチューニングする手法)を実装した」ということになります。

 吉沢亮主演の映画『AWAKE』は、このころのお話。

駒の位置関係を数値化して、位置関係が似た局面を学習済データから選び出す。

 将棋という競技には、プロ棋士の棋譜1万局を教材として使うことが可能という好条件がありました。
 つまり、「自分は弱いから下手に考えず、ただ強い人の棋譜を覚えてパクる」ということが可能だったのです。

ここから先は

1,694字 / 4画像

¥ 300

期間限定!Amazon Payで支払うと抽選で
Amazonギフトカード5,000円分が当たる

この記事が参加している募集

貴重なお時間を使ってお読みいただき、ありがとうございました。有意義な時間と感じて頂けたら嬉しいです。また別の記事を用意してお待ちしたいと思います。