Just Stop26歩よりもR45ぐらい強い振り飛車評価関数(Just Counter 26歩)を販売します
2022年11月の第3回世界将棋AI電竜戦本戦、及び、 第1回マイナビニュース杯電竜戦ハードウェア統一戦に参加したJust Stop 26歩の評価関数に対して再学習を施して少しだけ強くなった振り飛車評価関数、その名も「Just Counter 26歩(jc26)」を販売します。
ダウンロードはこちらから(評価関数は有償(100円)です)
js26は定跡無しで飛車を振る、水匠をはじめとした入賞ソフトの多くに振り飛車で勝つなど、いずれの大会も振り飛車ソフトとしては最高成績を上げる(6位、9位)と2023年2月時点でおそらく最強の振り飛車将棋ソフトであると思われます。jc26はそのjs26よりもさらに強い評価関数であり、2023年4月時点では最強の振り飛車評価関数であると思われます。
レーティングの測定方法
たややん互角局面 を初期局面とし、cshogiの対局機能を用いてレーティングを測定しています。思考エンジンはdlshogiを用いており、エンジンの設定は1手2秒、推定勝率が20%以下になったら投了、それ以外はデフォルトとなっています。cshogiから出力されるpgnファイル、logファイルはjc26_onnx.7zに含まれています(このデータを閲覧するだけであれば、noteの購入は必要ありません)
勝率データ
furi0327 vs js26: 349-266-51 (56.2%)
Black vs White: 320-295-51 (51.9%)
furi0327 playing Black: 180-126-27 (58.1%)
furi0327 playing White: 169-140-24 (54.4%)
js26 playing Black: 140-169-24 (45.6%)
js26 playing White: 126-180-27 (41.9%)
Elo difference: 43.5 +/- 25.6, LOS: 100.0 %, DrawRatio: 0.1 %
その他ベンチマーク
floodgateの2018年、及び2023年の棋譜(いずれも教師データに含まれていない)に対する一致率を測定した結果は以下のとおりです
js26
floodgate-2018:test_loss = 1.45761466, 0.44447339, 0.63368116, 1.96509424, test accuracy = 0.51693594, 0.76182187
floodgate-2023:test_loss = 1.31996458, 0.45850606, 0.59131253, 1.82269519, test accuracy = 0.55289614, 0.74293640
jc26
floodgate-2018:test_loss = 1.45242616, 0.44576478, 0.61322260, 1.95395440, test accuracy = 0.51781875, 0.76338125
floodgate-2023:test_loss = 1.31641653, 0.45905502, 0.57962625, 1.81562177, test accuracy = 0.55430406, 0.74534485
dlshogiの公開評価関数
floodgate-2018:test_loss = 1.42889538, 0.43191438, 0.60557163, 1.91863762, test accuracy = 0.52288281, 0.77774687
floodgate-2023:test_loss = 1.32502731, 0.45492129, 0.57118539, 1.81866454, test accuracy = 0.54610214, 0.74470979
dlshogiに比べると2018年の棋譜の一致率が低いです。dlshogiの方がより広い教師局面を用意していることに起因すると思われます。一方でjs26やjc26は2023年の棋譜の一致率が高いです。js,jcが近代のAIの棋譜から生成したデータを多く用いていることに起因すると思われます。
その他雑多な特徴
js26とは若干棋風が異なります。例えばjs26は先手の初手では端歩をつく傾向にありますが、jc26は76歩を指します
人間らしいといえば良いことですが、将棋大会の実戦心理的には良くないかもしれません
ライセンス
【個人利用向けライセンス】
本学習済評価関数(onnxファイル)を対局・定跡作成・各種将棋AIの大会にご利用いただけます。ただし、各種ドキュメントファイルやPR文章に本学習済評価関数を使ったことを明記してください。
【デュアル・ライセンス】
Qhapaq開発チームは、本学習済評価関数を、将棋AI開発の促進と各種将棋AIの大会の競技性の維持の両立を目的とし、2023年5月3日以降は上記個人利用向けライセンスと、下記開発者向けライセンスによるデュアル・ライセンスモデルで提供します。
【開発者向けライセンス(2023年5月3日より有効)】
2023年5月3日以降については本学習済評価関数をCC-BY-SA3.0のもとご利用いただけます。詳細は
https://creativecommons.org/licenses/by-sa/3.0/deed.ja
をご参照ください
【本モデルの教師データについて】
本学習済モデルは教師データに、dlshogi開発チームが販売している書籍 「強い将棋ソフトの創りかた」付属のデータを用いています。本モデルを将棋AIなどの大会で活用される方は、本書を購入することをおすすめいたします。
解凍パスワード
ここから先は
¥ 100
この記事が気に入ったらチップで応援してみませんか?