【テクノロジーの話】【将棋の話】将棋AIの進化についてのまとめ
本記事は途中まで無料で読めます。
黎明期(1970-90年代)
序盤中盤は不安定で、終盤だけが強い
水平線効果
このころのソフトウェアは、ある局面からN手後の局面までを全探索し、各局面の価値を評価関数を用いて評価することで、評価値の高くなる候補手を選んでいました。
そうすると、水平線効果により、とんでもない悪手を指してしまうことがあります。
水平線効果とは、有限深度Nで探索を打ち切ってしまうために、長期的に見て問題のある選択をしてしまうという、人工知能特有の問題です。
水平線効果は、「コンピュータが年々進化し、その計算能力向上を生かす」とか、「将棋の実力がより高い人が評価関数をチューニングする」という方法で改善されていきます。
チューニングとはつまり、「無駄な手を候補から外して、有力な手に絞って深堀りする」ことで、探索深度Nが増えました。
終盤力
終盤では、詰め将棋専用のルーチン(=ある局面で詰みがあるかどうかの探索)が有効でした。
探索範囲が「王手およびその対応」に限られるため、ソフトウェアにとっては得意な処理になります。
そのため、詰将棋を解く棋力では、1968年という早い時期にアマチュア三段と認定されていました。
週刊誌の企画で人間対コンピュータの詰将棋早解き競争が行われ、日立HITAC5020は人間とほぼ互角の成績だったという記録が残っています(人間側の49勝53敗)。
発展期(2000年代~2015年)
自分の弱さを認め、強い人をパクって強くなった
機械学習の登場
2000年代、Bonanzaの成功により、機械学習がブレイクスルーとして脚光を浴びるようになりました。
細かく言えば、「学習済みデータを教材とした教師あり学習(プログラムが教師の手を最善手として選ぶようにチューニングする手法)を実装した」ということになります。
吉沢亮主演の映画『AWAKE』は、このころのお話。
将棋という競技には、プロ棋士の棋譜1万局を教材として使うことが可能という好条件がありました。
つまり、「自分は弱いから下手に考えず、ただ強い人の棋譜を覚えてパクる」ということが可能だったのです。
ここから先は
¥ 300
Amazonギフトカード5,000円分が当たる
この記事が参加している募集
貴重なお時間を使ってお読みいただき、ありがとうございました。有意義な時間と感じて頂けたら嬉しいです。また別の記事を用意してお待ちしたいと思います。