精密採点Aiについて雑記 ~カンストに必要な考え方編~
はじめに
こじがみさまです。この名前を自分で名乗るのが恥ずかしいんじゃないかということに気づいたところです。ちなみにバイト先でも生徒から「神」と呼ばれています。前回の最後に書いたように、今回は総合100点を取るために必要な知識を項目ごとに書いていきます。
総合100点を取るために必要な知識
それでは実際に「100点を取るために必要な知識」について説明していきます。注意してほしいのは、「100点を取る方法」ではない点です。また、人によっては今更かよって感じだとは思いますが、これ以降総合100点を取ることを「カンスト」と呼ぶことにします。ちなみに、素点の状態で既に100点にすることも可能で、界隈ではこれを「ソテカン」と呼んでいます。それとの対比で、ボーナス点込みでカンストすることを「ボナカン」と呼びます。ここでも以降そのように書くことにします。
各項目の目標ラインなどについて
総合100点を狙うためには、前述のチャート5値をかなりの高水準にもっていく必要があります。具体的には、音程92~97%、安定性98以上、表現力98以上、リズム96以上、VL98以上というのが個人的な目安です。ただし、これはあくまでも「できればこのくらいは欲しい」というラインであり、上の5つの数値そのままだとおそらく総合100点を取るのは不可能です。例えば表現力が98なら他でその分頑張らないといけません。逆に言えば上の数値よりも低い項目があっても、他の4項目をめっちゃ頑張れば総合100点を取れることもあります。ちなみに音程のところでこのような書き方をしたのは、「音程正確率が高すぎると逆に減点される」とされているからです。
あまり需要の無い話かもしれませんが、参考までに今まで見てきた総合100点のリザルトたちの中でのチャート5値それぞれの最低値を書いておくと、音程89%/100%、安定性96、表現力97、リズム93、VL95です。いずれも他の4値が理想に近いときの話です。自分のデータに限れば下の図のようになりました。
各項目のウエイトについて
先ほどの目標ラインの数値を比べると容易に想像がつくとは思いますが、項目によってウエイトが異なります。たとえば同じ90代後半くらいの数値の場合で比べても、リズムが1下がるのと表現力が1下がるのとでは後者の方がダメージが大きいです。
また、当たり前かもしれませんが、チャートの各値の重みはずっと均一だというわけではありません。また、例えば音程95(理想値)のときを基準とすると、94のときと93のときとを比べても減点量はちょうど2倍になるわけではありません。一般に理想から離れれば離れるほど減点が厳しくなっていくと考えられます。
ではまず一番大事なのは何かというと、音程と表現力です。この二つのウエイトは特に大きく、特に表現力に至っては96以下になるとほぼ必ず絶対間違いなく十中八九カンスト圏外になります。音程については92%や97%でもカンストはそこまで難しくないですが、できれば93~96%に収めたいです。
次に大事なのが安定性とVLです。チャートでの位置から「両腕」と言われる2値です。どちらも最低ラインと言えるのは96程度ですが、やはり現実的には98以上取っておきたいです。一応両方97でカンストしたデータもありますが、他の3値が理想的な場合の話ですね。
最後にあまりウエイトが重くないのがリズムです。上述のようにリズム93でカンストした人もいるくらいです。有志の検証によるとリズム94~95でも総合得点で見るとリズム99のときと比べて0.1点くらいしか減点されていないようです。ただ他と比べて特に意識しなくても安定して99を取れてしまう項目なので、欠けていてもいいやで放置するといつもと感覚が変わってしまいますから、カンストを目指して詰めている段階であれば早めに調整しましょう。
💯まとめると、チャート5値の重要度は異なり、大まかなイメージとしては
(表現力)≒(音程)>(VL)≒(安定性)>(リズム)
という感じです。基本的には各値を高水準にする必要があるのですが、音程に限っては数値が95を超えてしまっても逆に減点されるので要注意です。
音程について
これは皆さんの想像通りだと思います。
音程が正しければ正しいほど評価が上がります。ですが直前に書いたように95%を超えてしまうと逆に減点されてしまうようです。以前からあった仕様のようですが、前作と比べてギリギリの戦いを強いられる今作ではこの音程減点の影響も相対的に大きくなりますので、こだわりがなければ95%に近づけることを意識しましょう。
細かいところ(減点の仕方など)まで見るとおそらく前作とは変わっているのですが、少なくとも前作の仕様では「音声の入力が一切なかった」バーの評価は0%になってしまうのに対して「音声を入力したが大きくずれていた」バーの評価は0%にならないので、今作でも無言よりかは音を外す覚悟で何かしら歌った方が音程の項目は上がりやすいはずです。
前作からの細かい変更点として、バーの長さが一定以下だと音を外した時の減点率が低くなったようです。ラップ地帯などの細かいバーが続く箇所だとその差を感じやすいかと思います。また、後述の「ハンマリング・オン歌唱」など一部のウラ技法が検知されたバーでは音程が一旦外れ扱いになっても後から正解に修正されることがあるようです。ありがたいですね。
💯まとめると、とにかく音程を合わせることが大事です。例外として95%を超えてしまうと無視できない量の減点があるので、音程を取るのが得意な人は注意が必要です。またいくつか細かい変更点があり、総じて我々歌唱者側に有利になったようです。
表現力について
前述の通り抑揚と表現技法の2項目からなっています。この両方をかなりの高水準までもっていかないと先ほどの表現力の目安ライン(98)に到達できません。表現技法をいれまくれば抑揚を疎かにできるわけではなく、具体的には
抑揚が100→表現力は最大100
抑揚が96~99→表現力は最大99
抑揚が92~95→表現力は最大98
抑揚が88~91→表現力は最大97
のように抑揚の欠けを表現技法でカバーできる範囲は決まっているとされています。
①抑揚
全体を通して大小の割合が1:2くらいになっている状態がベストだと言われています。また、声量差が小さすぎてもダメですが大きすぎてもダメで、この辺は経験による慣れになってしまいます。
あくまで経験則ですが、抑揚が92以上の小さい減点をされているときは声量差よりも割合の方を見直すとうまくいくケースが多いです(必ずそうというわけではありません)。大が多すぎるのか小が多すぎるのか数値的に判断する術は現段階で判明していないので、何回か歌って微調整する必要があります。
💯まとめると、今作の抑揚は「声量差」と「大小の割合」の2つの要素で評価されていると言われています。減点されている場合、その原因は「声量差」に問題があるか「大小の割合」に問題があるかの2つに大別できますが、それぞれどっちに偏っているのか数値から明確に確認する術はないので、微調整していく必要があります。
②表現技法
この項目に限らずですが、自分もよく分かっていないことや間違って認識していることがまだまだありそうなので、随時加筆・修正を繰り返していきたいと思います。指摘すべき点があればぜひ指摘していただきたいです。
まず現段階で実装されていると思われる技法を一覧にしておきます。
〇オモテ技法
・しゃくり
・こぶし2種
・フォール
・ビブラート
〇ウラ技法
・(順V字)アクセント3種 (以降「順V字」や「V字」と略します)
・逆V字アクセント (以降「逆V字」と略します)
・L字アクセント2種 (以降「L字」と略します)
・フライダウン (以降「FD」と略します)
・大しゃくり
・早いしゃくり2種
・ハンマリング・オン (以降「ハンマリング」と略します)
・プリング・オフ (以降「プリング」と略します)
・スローダウン (以降「SD」と略します)
・逆こぶし
・ヒーカップ2種
・早いフォール
・エッジボイス
・フォールエッジ
主な技法は上記のものです。他にもたくさん技法が存在することが明らかになったのですが、わからないことが多すぎるので、一旦それらには触れないものとします。
リリースから半年間はオモテ技法と同様にウラ技法がそれぞれ何回検知されたか確認する方法があったのですが、2022年9月20日現在では確認する方法はありません。そのため、感覚である程度認識する必要があるのですが、これも上述の抑揚と同様にある程度判別するためのヒントがあります。これが前述の「ピンクの線が飛んでいく」現象です。オモテ技法が検知された箇所からメーターにピンクの線が飛んでいくのはご存じだと思いますが、実はこのピンク線はウラ技法が検知された個所からも飛んでいく仕様になっています。具体的には検知されたタイミングに関わらず、アクセント系としゃくり系とエッジボイス(以降「先頭族」と括ります)はバーの先頭から、ハンマリングとプリングとSDと逆こぶし(以降「中央族」と括ります)はバーの中央から、ヒーカップ系とフォール系(以降「末端族」と括ります)はバーの末端から飛んでいくようです。ある程度狙ってウラ技法を検知させられるようになってきたら、「狙った技法が検知されたかどうか」だけを見ればいいので、だんだん正確に把握できるようになってくるはずです。
重みについてですが、オモテ技法(特にしゃくりとこぶし)はかなり軽いと見ていいと思います。ただし、「しゃくりが検知されたバーでは安定性の減点が発生しない」「こぶしが検知された前後一定時間は安定性の減点が発生しない」などの説があり、個人的にもある程度は信ぴょう性があるものだと思っているので、表現力の加点目的ではなく安定性の保険目的で狙うというのは有効だと思います。表現力の項目に含まれているのになんだか変な話ではありますけどね。
ウラ技法同士で比べた重みについてはおそらく
(逆こぶし以外の中央族)>(アクセント系先頭族)>(逆こぶしと早いフォール)>(しゃくり系とFDとヒーカップ)
という感じではないかなと思います。エッジ系についてはまだ狙って検知できる段階ではないので分かりません。これについてはあくまで体感の話であり、回数を確認できない以上正確に検証しきれないので目安程度にしてください。詳しくは表現技法をまとめた記事に書きます。また、リリース直後(以降「初期」と呼びます)から言われているのは、「いろんな種類の技法を入れた方が高評価になりやすい」ということです。これも断言はできませんが、例えば似たような技法であるハンマリングとプリングであれば、
(ハンマリング プリング10回ずつ)>(ハンマリング20回)=(プリング20回)
という評価になっている可能性はあります。
また、先ほどの音程のところで触れたように一部のウラ技法には音程が正しかったことに歴史修正する効果があるようで(ソースは公開特許公報の中の文言ですが意味を読み違えていたらすみません)、「中央族」3種と逆V字、L字、FDがこれに該当するようです。明記されていないだけで他の技法にも同様の効果があるかもしれません。
前回の復習にはなりますが、表現技法を十分な数検知させるためにある程度長い曲であることが重要で、前作からそうだったフォールに加えてL字アクセントやFD、逆こぶしなどの一部のウラ技法がオク下だと全く検知されないので、等オクでの攻略が基本となります。
💯まとめると、表示されるオモテ技法3種以外に隠れたウラ技法が多数確認されており、おそらく後者の方が重みが大きいです。また後者の中でも重みが異なるものがあり、いろんな種類の技法を入れた方が評価が上がりやすいと言われているので、できるだけ多く習得した方が有利です。一部のウラ技法には音程が正しかったことにする効果や安定性の減点を抑える効果があると考えられているので、表現力の値を上げる以外の目的でも表現技法を利用することができます。また、オク下だと検知されない技法がいくつかあるので、等オクでの攻略が基本となります。
ビブラート&ロングトーンについて
読んで字のごとく「ビブラート」(以下「ビブ」と略します)と「ロングトーン」(以下「ロング」と略します)の2項目からなります。それぞれ確認できるのは0~10の11段階での評価ですが、内部的にはもっと細かく計算されていると思われます。
体感ではビブが評価9以下になった時の方がロングが評価9以下になった時よりもダメージが大きいように感じます。目安としては「ロング評価9以上」「ビブ評価10」を満たせばほぼ確実に合格だと思います。少なくとも自分の記録だとロング評価10かつビブ評価10のデータは全てVL99以上になっているので、両方が見た目上満点ならかなり安心です。
ちなみに、自分のカンストデータ417個のうち、ロング評価8のものが20個、ビブ評価9のものが43個で、どちらかがそれを下回るものはありませんでした。ちなみにロング評価8かつビブ評価9でカンストしているものも4個だけありましたが、レアケースなのであてにしないでください。
①ビブラート
評価に影響するのは下段に表示される回数や秒数ではなく、「上手さ」です。実際リザルト画面にも10段階評価の横に「上手さ」と書かれています。具体的には「波形をきれいな余弦波にすること」が重要になってきます。基準ピッチから一定のピッチまで下げて戻す作業を一定間隔で行うということです。余弦波とは書きましたが、波の形状まで細かく見られているかは正直自信をもって断言できません。
一定のピッチ差と一定の間隔(振幅と振動数)というのが重要です。基本的には右側に表示される「ビブラートタイプ」が一回の歌唱を通じて同じになるように意識する必要があります。細かいビブラートとゆったりとしたビブラートを混ぜるのはあまりよくないということです。(追記)前作と同様にビブラート一回一回の波形がそれぞれで一定になっていれば、一回の歌唱を通して違う種類が混ざっていても大丈夫かもしれません。自分はそれをやると必ずと言っていいほど評価が悪くなるので、一応曲を通して同じになるようにしていますが。(追記終わり)
波形を一定にすることを考えれば必然的に「ボックス型」、中でも比較的ゆったりとしたBタイプやCタイプのビブラートが有利であるという結論になります。もちろんAタイプ(細かいやつ)を使いこなしている人もいますし、なんならEタイプ(下降型)でカンストしている人までちらほらいます。そうなると必ずしも「余弦波」である必要はなさそうですね。調べてみると自分もDタイプやEタイプでVL99を出したことはあるみたいです。現実的にはBタイプかCタイプになるように調整することが高評価への一番の近道です。
また、それを阻害する要因としてよくあるのが「オートビブ」です。狙っていないところでビブラートが検知されてしまう現象で、波形の乱れに直結します。多少ならオートビブが検知されてしまっても他の場所に理想的なビブラートを入れまくることである程度減点を希釈できますが、そもそもビブラートを入れられるバーが少ないような曲では超強力な天敵です。そしてそういう曲は十中八九オートビブを誘発しやすいという、、、。このオートビブに苦しめられ、緑の2つ山アイコンがうにょにょんと生えてくる光景がトラウマになっている人も少なくないでしょう。
ちなみに秒数や回数は一切関係しないかのような書き方をしましたが、実際には例外があり、総秒数が表示上1.7秒未満のときには強制的にビブ評価が0になるという悪魔のような仕様があります。前作ではこのデッドラインが1.0秒だったので、前述の間奏ビブ廃止も相まってかなり厳しくなったと言えます。また、そもそも短いビブラートをたくさん入れるよりもある程度長めにビブラートをかけた方が当然波形は安定しやすいので、回数や秒数も場合によっては指標になり得ます。自分は(秒数)÷(回数)が1以上になるように意識しています。
💯まとめると、ビブラートで高評価を取るには波形を一定にする必要があり、その点でBタイプやCタイプが有利です。また、合計秒数が表示上1.7秒未満になると強制的にビブ評価が0になってしまう他、1回のビブラートがある程度長い方が必然的に波形が安定しやすいので、回数や秒数も完全に無関係とはいえません。
②ロングトーン
これもビブラートと同様に上手さが肝になってきます。具体的には「声が震えずピッチが一定であること」と「そもそもピッチが正しいこと」の2つが重要になります。これについては読んだままの理解で大丈夫ですが、声域の両端付近や換声点付近では無意識に声が震えやすいので、該当するピッチのバーではロングトーンを狙わない方が良いと思います。
ロングについても秒数や回数が完全に無関係というわけではありません。まず秒数が短すぎる(0.833秒未満だと考えています)と評価が8以下になりやすいので、1回である程度の秒数を確保する必要があります。逆に長く伸ばせば伸ばすほど当然後半でミスをするリスクは大きくなります。また、ある程度慣れてくると点数のためにウラ技法の検知をガンガン狙うようになってくるのですが、そうなると表現技法(特に中央族)を検知させるのに失敗する機会が増えます。その際に採点側が「今のは乱れたロングトーンだろう」と判断してしまうためか、他のところでちゃんときれいなロングトーンを入れているのに評価が下がってしまうことがあります。可能な曲は限られますがその減点を希釈するためにロングトーンを少し多めに入れるという戦略も一応存在するので、場合によっては回数も評価に影響するとも言えなくはないでしょう。
💯まとめると、ロングも秒数や回数よりも上手さが重要で、「声が震えていないか」「ピッチが正しいか」の2点を見られています。伸ばしにくいピッチのバーでロングを狙うのは避けましょう。また、1回である程度の秒数を確保する必要があるほか、状況によっては狙う回数を少し増やした方が評価が上がる場合もないことはないです。
安定性について
正直自分もよくわかっていない項目です。
ロングやビブと同様にリザルト画面2ページ目では0~10の11段階で表示されますが、チャートを見ると分かるように、実際にはもっと細かく計算されています。
声が乱れると減点されるようなので、ロングの失敗時やバーとバーの境目付近などで削れるイメージがあります。また、前述のオートビブに加え、そもそもの基準音が本来のピッチよりも下がっている「フラットビブ」やその逆の「シャープビブ」も安定性を下げる原因となるようです。以上から必然的にVLと正の相関が表れます。
また、ロングの項目で触れた内容と被るのですが、表現技法を検知させるのに失敗したときに、それを乱れと判断されてしまい安定性の項目が減点されることがあるので、かなりのデータ数を集めれば表現力との相関もありそうな気はします。特に中央族の失敗はかなりこの項目に響くのではないでしょうか。自分はそれが怖いので確実に検知させられる自身があるところのみに絞るようにしています。
実際に採点する中で「ここはビブラートをかけよう」「ここでハンマリングを狙おう」などと考えながら歌っていくことになると思いますが、逆に何も狙わないバーでは下手に伸ばさずに潔く切ってしまいましょう。前作の経験者は今までもずっとそうしてきたはずです。
💯まとめると、声が乱れると減点される項目だと思われるので、とりあえずできるだけ区切って余計なことはしないようにしましょう、何かするなら確実に成功させましょう、という感じです。
リズムについて
たぶんこれを書いたら今回は最後です。
この項目は発声のタイミングが基準から早すぎたり遅すぎたりしないかで評価されているようです。早すぎると「走り」、遅すぎると「タメ」と評価されます。下にも少し書きますが、走りの方が減点が大きいのはほぼ間違いないです。
見た目上の評価としては走り3~タメ3の7段階になっていますが、これもチャートを見ればわかるように0~100の101段階まで確認することができます。見た目上走りタメ0でも、内部では減点されていることがよくあり、タメ寄りのときは最大98まで、走り寄りのときは最大87まで減点されるようです。
(追記)内部ではやはりチャート5値にそれぞれ小数点以下が存在しているのは間違いなさそうで、その関係で見えている整数部分の値が同じでも目盛りが違うことがあります。あまり気にするほどではないですが、例えばリズム98で目盛り0のときは安易に走りなのかタメなのか決めつけない方がいいかもしれません。(追記終わり)
実際にはそこまで意識せずともそこそこ安定して99になりやすい項目ですが、逆に100になることはどんなに意識しようともかなりレアです。アーチェリーの的のように100点に該当する範囲が非常に狭く、99点のカバーする範囲が広いイメージです。
ひとつ気を付けるべきなのは「曲によっては聞こえてくる音とバーのタイミングの設定がズレていることがある」という点です。これに気づかないまま歌い切ったら大幅減点、なんてこともあります。厄介なのは「生音演奏」バージョンの譜面です。通常音源ではいい感じにリズムが取れていたのに生音の方にしたらボロクソ評価になった、なんてこともあります。稀にですが逆に通常音源の方だけがズレていることもあるようです。慣れれば目視である程度調整できますが、基本的には失敗したら次で調整するというスタンスでいいと思います。
💯まとめると、リズムは発声のタイミングの正確さを見ている項目で、意識せずとも99になりやすいが100には滅多にならないという性質があります。タイミングが本来よりも遅くなってしまっていると「タメ」、早くなってしまっていると「走り」と評価され、後者の方が減点が大きいです。音源によってタイミング設定がズレていることがあり、特に「生音演奏」バージョンには要注意です。
おわり
以上、ご精読ありがとうございました。