HalfKPE9型の評価関数の検証を始めました

tttakさんがHalfKPE9型の評価関数を公開されました。
これは“自玉または敵玉の位置、玉以外の駒の位置、利き数の組み合わせを特徴量としたNNUE評価関数と実行ファイルです。”とあるとおり、標準のNNUE型の評価関数に利き数の考慮を追加したものとなり、評価関数のサイズも約552MBとKPPTに近いぐらいビッグになっています。

特徴量が増えているのですから当然、表現精度も上がっていると思われますが、その分探索にかかる時間も増えており、標準のNNUE型のNPSの大体3分の2ぐらいになっています。
この表現精度アップによる棋力向上と、NPS低下による棋力ダウンを天秤にかけ、トータルで強いのか弱いのかを検証していきたいと思います。

まず、tttakさんのgithubからソースをcloneしてきて、やねうら王人造棋士18号カスタムに改造します。
Hefeweizen、Kristallweizenは、この18号カスタムの学習処理のおかげで強くなったので、同じことをHalfKPE9型にも適用します。

Kristallweizenの自己対局棋譜を約1億局面作ってあったので、これを食わせてみます。
公開された評価関数はFloodgateでも対局されており、けっこう強いのがわかっていますし、他の方も検証を行なっているので、自分は学習パラメータの落とし所の調査と検討モードでの使用ならこっちのほうがいいんじゃね?という個人的な希望により、このような方法を採りました。

対局条件は、
・定跡なし
・Ponderなし
・1手depth 24か6000万ノードまで
・320手で引き分け
・contemptは101
・rerign valueは9999

としています。これは持ち時間内での強さを見るのではなく、ある程度の精度で対局した時の強さ、指し手の精度を見ることを目的としているためです。
ご存知のとおり、Kristallweizenはある程度読ませないと読みが安定しないため、実力を発揮できる最低ラインに設定してあります。

現在対局中ですが、早くも読みの食い違いが多数出ており、反省合戦の様相を呈してきております。^^;

結果は追って報告します。

この記事が気に入ったらサポートをしてみませんか?