
電竜戦不参加とHalfKPE9型の振り飛車評価関数作成
表題の通り電竜戦不参加とHALFKPE9型の振り飛車評価関数作成について書きたいと思います。
電竜戦不参加についてです。以下のツイートのように今回は不参加と決めました。いくつか理由があるので書きます。
#電竜戦 、予行演習に参加していてあれなのですが予行演習でもうちょっとスペックが高くないと勝ち星が集まらないかなと思い、今回は参加を見送りにしたいと思います。
— 詰み逃しのオールラウンダー・コウキ (@Shinryuu_Shogi) November 14, 2020
PCのスペックが低いことが理由です。今、自分が使用しているPCは ノートPCのCore i3-2370M (2コア 4スレッド)です。おそらく予行演習を含め参加者全体で一番低いかと思われます(?)序盤で定跡がヒットし、時間を稼いでも中盤以降計算量で巻き返されることが多々ありました。 また、評価関数の作成に必要な教師データもDepthを低くしたり、教師の量を減らすなどの工夫をし、定跡作成も工夫しなければ効率が悪い環境です。そのため、今回は不参加とし、PCが他の参加者と相当なスペックになったら参加することに決めました。
HalfKPE9型の振り飛車評価関数についてです。先述の通り、電竜戦不参加を決めたため、定跡作成などを急ぐ必要がなくなったので、HalfKPE9型の振り飛車評価関数を作ってみようと思いました。HalfKPE9型評価関数というのはtttakさんが公開している評価関数です。学習に使う教師はたややんさんが公開している振り飛車教師を使っています。今のところは☗2六歩☖3四歩☗2五歩☖3三角☗7六歩☖4四歩の局面で☗4八銀などを指した局面で検討させると☖4二飛車や☖9四歩といった手が候補に挙がるといった状況です。ただ、最初から振り飛車を目指すわけではないのでそこが今のところの課題です。いろいろ学習パラメータを変えてみて学習を試してみようと思っています。
追記:W@ndreERの開発者さんがHalfKPE9型の評価関数を雑に振り飛車化(失礼)したものを公開しているようです。
HalfKPE9を雑に振り飛車化したものを置いておきますね。
— W@nderERの中の人 (@ihme_vaeltaa) March 29, 2020
ひとまず検証対局はデファクトNNUE(HalfKP256)で1手15Mノード相当になるようにして行いました。(KPE側は凡そ8Mノード)この条件だとどちらも対Kristallweizen勝率15%程度の玩具です
(続く)https://t.co/2PE3sytOdLhttps://t.co/LVS8GnbKzY