RTA戦略の探索:ドラクエ8 (PS2版) 制限4種(メタル,チーム,くちぶえ,リセット)


0.はじめに

 2022年から2年ほど、制限4種(メタル、チーム、くちぶえ、リセット)でのRTAを研究しています。戦略検討は、2024年6月頃に一区切りしました。
 この記事では、その検討の「方針」的なもの、より正確に言えば「どんな領域で、何を最適化する探索を、行ったつもりになっているのか」について、まとめておきます。
 RTAが題材ですが、抽象的な話になります。具体的な攻略内容は、こちらをどうぞ。→https://note.com/uniright2/n/nb34178cd600c

ドラクエ8に関する、すべてのネタバレ情報を含みます。ご注意ください。
 自己紹介: 右弐(よみかた うに) https://twitter.com/uniright2 

RTAの構成要素:planning / playing

 「RTA」を語るとき、ざっくり「戦略・戦術」と「プレイ」に2分されることは多いです。ただ「戦略・戦術」と書くと長い上にこの概念は近年「チャート」という語で表されることも多いです。この記事では「プレイ」との対比だけできればいいので、「planning」と表します。
 そして、この記事は、planning についての話がメインです。

方針的なもの:5つの優先順

 「制限4種」なので、当然その4つは守ってplanningを行いますが、その際の自分の「方針」的なものに、次の5つがありました:
1.「明らかに遅くは」ない
2.経験値のみが目的の「無駄歩き」がない
3.planning からの「逸脱率」を低く抑える
4.難関の「突破率」を上げる
5.通しプレイの「想定タイム」を短縮

 このうち、1.2.は制約条件という位置付けのため、この1,2の領域内で「探索した」といえます。
 これに対し、3,4,5は最適化の項目で、優先順位はこの順です。
・・・何のことやら、わからないと思うので、以下1~5で説明します。

1.「明らかに遅くは」ない

 RTAをやる前提なので、どんなに良いplanningでも「タイム的に圧倒的に遅い」ものは避けました。
 例えば、攻略で最難関になる「ラプソーン(ちび)」に必勝と言える戦術があるけど、その戦闘に3時間かかるという場合、それは採用しない、ということです。
 「明らかに遅い」の明確なライン引きがあるわけではなく、あくまで主観的なものです。

2.経験値のみが目的の「無駄歩き」がない

 戦力をきめる3大要素は「レベル」「スキル」「錬金」です。このうち「レベル」「スキル」は経験値、「錬金」は移動を必要とします。
 そして「くちぶえ」が使えない関係上、経験値にも移動を要するので、「強くなるためには、歩くしかない」ということになっています。

 ただ、経験値のためだけに移動を増やすなら、それは「くちぶえ」を使えない制約が単にロスになっているだけで、制約が何も新しい「楽しみ」を生み出せていないと言えます。
 つまり、経験値だけが目的の「無駄歩き」を含むplanningが仮に最適になる(*)ようなら、この「制限4種」そのものがイマイチなルールだったといえます。

 というわけで、もしかしたら現実は(*)の世界線なのかもしれないなあ、とは思いつつ、そうでない側のplanningを、この2年ほど考えてきたということです。
 実際、経験値が主目的の移動は多くなりましたが、アイテム回収と錬金をからめて、ある意味「偽装」することには成功しています。そして、この「偽装」された planning の領域で探索する方針は、最適化の上でも効率が良いとも思っています。移動にたくさんの意味が重なっていればその分有利なためです(つまり、現実は(*)の世界線でない可能性が高いと思っています)。

 説明は以上ですが、整理のため移動を便宜的に6種に分け、表にまとめておきます。

ドラクエ8 移動の種類

 今回の攻略は、①~④で構成しており、⑤⑥は含みません。
⑤は「錬金」のみを目的とした無駄歩き
⑥は「経験値」と「錬金」を目的とした無駄歩き
といえます。⑥で錬金をしていないケースが最適なplanningに含まれる世界線が、(*)に相当します。

3.planning からの「逸脱率」を低く抑える

 これは、俗にいう「想定したチャートから外れた時の~」というやつで、それが起きる確率そのものを、低く抑えるということです。

 冒頭でRTAを 2分しましたが、次のように3つに分けたほうが「漏れ」がないでしょう:
あ:planning
い:playing
う:planningで想定する形から逸脱したときの、リカバリー的なプレイ

 ここで「う」は、すでにplanning / playing とかで区別できるものではないと考えています。そもそも「逸脱」しているので、定義からしてplanされているはずはなく、したがって練習などで play の備えができているはずもないためです。つまり、何か別の力が試される局面です。
 図示すると次のような関係性です。

RTAの実際のプレイを、その要素で3つに区分

 この図において、赤いラインを「下に押し下げる」こと、すなわちplanning からの「逸脱率」を低く抑えることを方針としています。

 ここで、何をもって「想定内」とするか、という話になります。ドラクエは何がどうなってもその状態からクリアできるように作られているので、たとえば「勝てるまで再戦」とか「レベルを3つ上げて再戦」と言っておけば全てを「想定内」とできますが、その解釈に納得できるかは微妙です。このライン引きは、個人の主観に左右されると思いますし、それをすり合わせる必要もないと思います。

 そこで、個人的には1.「明らかに遅く」ないこと、をもう一度使って考えています。

 たとえば、あるボスで全滅したとき、そのボスとはすぐに再戦でき、消耗品を使わないか簡単に再調達でき、さらに勝率も下がらないような場合、「勝てるまで再戦」というplanningによって「想定内」にとどまる、という解釈には違和感はないです。(たとえば、「呪われし・・・」戦)。

 これに対し、①ボスまでが遠く、②貴重な消耗品をつぎ込む前提であり、③再戦は勝率が下がる、という事情がある場合には、全滅により「想定外」にこぼれおちた、と捉えるケースが出てきます。
(たとえば、「ゲモン」で負けると①が大きく、「ラプソーン(ちび)」で2回以上負けると②③が大きいため、これらが起こったら「想定外」扱い。また、道中でザオラルを唯一使えるククールが倒され世界樹の葉がなく拠点に戻る場合も、その地点によっては「想定外」)。

 そもそも、1.が主観的なものだったので、それをひきずった「想定内/想定外」の定義も主観的ですが、ある程度のイメージは伝わると思います。
 言い換えると「見せたい戦略を、予定通り見せられる確率を最大化したい」と思う場合に相当しています(そのために「戦略」そのものを適切に選んでおくべし、という方針なのでややこしいですが)。

4.難関の「突破率」を上げる

 これは単純で、ふつう「戦術の洗練」などと言われるものです。当然ですが、経験値が必要なキャラが生きている等の条件もふくみます。
 この4「突破率」自体は単純ですが、ここまでの1,2を前提としたうえで、3で触れた「逸脱率」が上がらない範囲で検討することになります。

 とくに、3「逸脱率」がだいじで、「世界樹の葉」の扱いに顕著に表れます。個々のボスに対する「突破率」よりも、planning からの「逸脱率」を優先するため、宝箱からの回収は「ラプソーン(ちび)」に挑むまで温存します。
 さらに宝箱回収も、一気に4枚全部ではなく2枚にとどめておき、その後の逸脱にも備えます。この判断ライン自体が最適かどうかはさておき、判断を生んだ背景は、3「逸脱率」を優先した方針にあります。
 
参考:世界樹の葉の調達について、以前に書いた記事はこちら
https://note.com/uniright2/n/n3a3973f6ba7a#241b757d-8536-46ec-a8dd-7dd4187899b8

5.通しプレイの「想定タイム」を短縮

 これも単純です。ただし、ここまでの1~4が優先です。1,2は前提として崩さず、3、4とのトレードオフも考慮しない、という意味です。
 たとえば、4で挙げた「突破率」を犠牲にして、5の「タイム」を追うことはしません(ただ、突破率を1%上げるために、その作業に10分かかるとすると、今度は1「明らかに遅い」に抵触します。ラインは主観的ですが)。 

 わかりやすい例としては「装備変更によるタイムロスの扱い」があります。例えばドルマゲス戦やラプソーン戦で、波動の後にゼシカがピオリムを撃つ際は、武器を外し「格闘の素早さ+10」を発動させます。ゼシカが先行され、怯んだり寝たり倒されたりしてピオリム未遂となると危険で、つまりこの装備変更は手抜くと「突破率」が下がります。それが何%なのかは吟味していませんが、装備変更しても戦闘全体で20秒程度のロスで済むでしょうから、1「明らかに遅い」には抵触せず、装備変更の一択です。サタンヘルムをキャプテン・クロウ戦で主人公が装備するもの、同類です。
 逆に、突破率に影響しなければ、普通にタイムを考えます。例えば、呪われし・・・戦は必勝と言って良いので、稀に打撃をするククールに「怒りのタトゥー」をもたせ装備変更するかの判断は、タイムのみで行っています。割に合わないので不採用ですが、もし必勝ではなかった場合は採用していたと思います。

 上記、装備変更の例はいわゆる「戦術」レベルですが、より広い「戦略」レベルでも同様です。たとえば「山賊のオノ」の錬金も、タイムとのトレードオフを検討したことはなく、単にドルマゲス戦の勝率に明らかに影響するため、距離が足りるなら作る、と判断しています。

おわりに

 RTAの 戦略構築にあたるplanning を「どんな前提で、どんな方針で探索したのか」という話をしてきましたが、こんな話が必要な気がしたのは、RTAの外側に特に目標を持たず「planning」を行ってきたからだと思います。
 RTAの外側の目標、というのは、たとえば「14時間を切りたい」といったもので、これがあるとそこから逆算し、planning の優劣が議論できます。
この種の目標としては、次のようなものがあるでしょう:
・〇〇時間を一度切りたい
・自己ベストを更新したい
・タイムの期待値を最適化したい
・最速タイムを出したい
・一発勝負で、良い記録を出したい
・対戦RTAで、勝ちたい

 しかし、こうしたものがないと(単独で明らかに良い/悪いといえるアイデアは別として)トレードオフの場面で優劣の判断がつきません。したがって、planning を評価する基準がなく決着がつけられないばかりか、そもそもどこに向かっているかもわからないことになります。
 とはいえ、現実的にこの2年、そうした混沌の中で過ごしてきたわけではなく、自分なりの「よさの感覚」を持って取り組んできました。それが何だったのかを、あえて「無理やり」言語化したのが、この記事になります。つまり、完全に後付けです。
 おそらく、これまで公開したplanningが、この記事で述べた方針に沿っていないことも、多々あると思います。それらの大半は planning のミスではなく、この記事が私の「よさの感覚」をうまく表現できていないことに起因する齟齬だと思います。

 RTAを始めてちょうど20年が経ちました。その間、この記事に書いたような内容は、折に触れて考えてきました。今回この記事を書くことを通じて、私自身は一段階解像度が上がりましたが、この記事までたどり着くようなコアなドラクエ / RTA関係者の方にも役に立つ可能性はゼロではないと思い、いまだ思索は不完全ながらも、ここに公開しておきます。

 2024. 7. 21 右弐

関連情報

・タイムアタック論(まんさく氏)
https://www.ne.jp/asahi/new/legend/mansaku/maniac_text/TAtheory/index.html 
戦略を確率分布でとらえる考え方が、説明されています。

・突破率 推定のすすめ(右弐)
 http://uniright2.fc2web.com/dq5/strategy_assessment.html 
この記事で行った3逸脱率と、4突破率に関連する話があります。

この記事が気に入ったらサポートをしてみませんか?