見出し画像

VOICEVOXを1年使ったのでメモ&レビュー

動画投稿、楽しい。
集中力は続かないけど、自分の妄想を試行錯誤しつつ形にしていく過程が創作意欲発散に効果てきめん。
今はSNSにぼそぼそと投稿してるだけ。人こわい。

お供に使うのはVOICEVOX。無料で使えるという点で目に留まり、使い始めたらすごく声がリアルでびっくり。合成音声は全く知識がなかったが、ゆっくりに慣れてたから余計に感動した。
ついでにめたんちゃんを起用してから伸びが非常によくなった。

有料のものに比べるとやっぱり劣るけど、無料にしてはかなりのクオリティだと思う。
(有料組の万超えな値段やCOEIROINK独自パラメータの難易度を知ってるとよけいに感じる…)

あと、基本的に二次創作が推奨されているキャラクターばかりというのも助かる。原作設定フル無視で独自路線貫いても喜ばれるキャラなんてそうそういない。

そんなVOICEVOX、出会ってどのくらい経ったかな?と見返すと、ちょうど1年くらい。
なので、ボイボを使ってきて思った感想も不満点も全部メモしておく。


VOICEVOXについて

VOICEVOXは最近リリースされた合成音声ソフト。
開発者のインタビューによると、ナレーションよりかはキャラクターとしての運用に重きをおいているスタイル。

ヒホさんが開発した、商用非商用問わず無料で使えるテキスト読み上げソフト

たくさんの公式デモビデオ

この売り文句の通り無料で、しかもクレジットさえすれば商用利用に制限なし。
しかし例外もある。例外もある。
VOICEVOX本体の規約の他に、キャラ本体の利用規約も合わせて確認する必要がある。
R18の可否、商用利用の制限、一部使用用途の禁止等。
もっとわかりやすくしてほしいなとは思う。
(前に利用可否の簡易表示をつけたらどうかという案があったけど、ほしい)

2024年6月現在のキャラ数は30名。全員声質が違うので案外ボイボだけで完結してしまいそうな勢い。
各キャラの主なCVは声優やVtuber、個人プロジェクト関係者等。プロもいればアマチュアもいる。
さらに『スタイル』という同キャラの別音声も使用できるので、合計するともっとある。
キャラの所有者もそれぞれ違う。規約の複雑さはこれが理由。
まだまだ増えるらしい。

トーク

トークUI。

テキストを打ち込むと、音声を生成してくれる。変換速度は遅め。
音質は可もなく不可もなく、言われなければわからない。
あと疑問符と伸ばし棒に弱い。自動調整も効いてるかわかんない。でも技術次第で解決できるので些細な問題。

音声調整

画像下の文字部分。基本アクセント、抑揚、発音の長さが設定できる。
抑揚というのは、普通に話したときに上がったり下がったりする声の波と言ったらわかりやすいかも。
投稿者のこだわりがひどく出る。
アクセントは簡易的な設定で、イントネーションの部分で詳細な抑揚が設定できる。無声化もラクラク。
クリックで分割&結合できたりと直感的で使いやすい。
YMM4上で設定できるのもありがたい。
でも文章かスタイル変更すると全部リセットされる。ちょっとタイムロスを感じる。

最初は難しそうでも、仕組みがわかれば数日でマスターできる。動画に調声という付加価値をつけれるのでおすすめ。

感情設定

速度、声のピッチ、抑揚、その他諸々が使える。
最高/最低が0.50/2.00、±0.15、 0/2.00だったりとバラバラなのでわかりにくい。
YMM4だと上限を超えて上げ下げできたりするのでよけいにわからない。
これを少し扱えるだけでも声のクオリティがかなりいいものになるのでおすすめ。
基本的に抑揚を0.70くらいにすると自然になりやすい。

ハミング(ソング)

(私は音楽制作をしたことがないので、専門的なことはわかりません。戯言と思って聞いてください)

ソングUI。

最近出たばっかりの歌える機能。全員&一部スタイル対応。
ピッチ調整も可。鍵盤を押すと音が鳴るので、耳コピしやすいです。
トーク用音源から無理やり歌わせてるのかな。すごい技術。

歌うと違和感が出る/ハミングに向いてない子がいる。
あとは、おしゃべりでも歌唱でもない曖昧な立ち位置の歌になっちゃう。『ソング』じゃなくて、『ハミング』って名前の通り鼻歌レベルにとどまってる。でも鼻歌にしては歌がうますぎる。

元々トーク専用ソフトを無理やり歌わせる文化はあったけど、公式が方法を用意してくれるあたりユーザーフレンドリーを感じる。


イチオシキャラレポートまとめ

使ったことある/比較的運用しやすそう/お気に入りのキャラだけですが、使用する際の特記事項などをつらつら。個人的メモもおまけで。

今後、追記で増えるかも。

ずんだもん

マスコットボイス。スタイルも豊富、エースなだけあって音質も使い勝手がいい。
声質も唯一無二なのでインパクトもある。

ネームバリューや特殊すぎる声質も考慮すると、やっぱりキャラとして使うのが最適解か。

今かなりの動画に使われているけど、政治利用等はもちろんクレジットを書かないのもアウト

四国めたん

低めのお姉さんボイス。一期生だけど、ずんだもんよりは扱いにくい。時々声がかすれる。でもスタイルが豊富なのでカバーはできるか。

キャラとしての運用推奨、でもずんだもんよりかはCV運用のハードルが低いか。

ずんだもんとセットで出すとより伸びる。
体温調節可能で汗かかないって設定、案外忘れられがち。

春日部つむぎ

正統派少女ボイス。The 素直。芯があるさわやかな声質。
かなり扱いやすい部類。感情表現はピッチで可。

キャラ運用もCVもいける。知名度もある。あとちゃんと歌えるしなりきりもできる(別売り)。

春日部と強いつながりがある。公式立ち絵の服を剥いで使うのは禁止である。公式も動く。
こちらもずんだもんと組ませるとうまくいく。

雨晴はう

低めの萌え声。デフォルトのイントネーションが整っているので修正が簡単。
ピッチで感情表現可。

特徴的な声なのでキャラ運用がメインか。公式はかなり動く。

ちなみに音声のR18は禁止である。イラストは公式のタグがある。
お気に入り。

白上虎太郎

男性らしい少年声。スタイルが豊富で声質も違うので幅広く対応可能。体感調整もしやすい。

意外といろんな場所で使われている。男性声の中では親しみやすい部類なのでCV運用も十分可能。

虎太郎含むVirVox Projectのファン層は少々特殊で、一般的なVOICEVOXのファン層から独立している印象がある(圧倒的に女性ファンが多い)。
18歳という設定なのでセンシティブもいける。

冥鳴ひまり

ダウナー少女ボイス。使い心地は普通。
でも素の声がフラットすぎて調声しても感情が表現しづらい。

CVとしての運用が効果的か。

追加生声ボイスパックはボリューム満載。なお淫夢を含む。

もち子さん

お姉さんボイス。案外フラットな声質だが、スタイルでカバー可能。

CVもキャラ運用も可。素材も豊富で固定ファンもいる。公式がかなり活発なので、宣伝してもらいたい場合はアリ。

音声作品、転売メインのコンテンツは禁止。
全体的にセンシティブ寄りな運営方針なので、好みが分かれやすい。

WhiteCUL

フレンドリーお姉さんボイス。難易度はかなり高い。
通常スタイルの喋りがユニークかつカタコトなので、びえ~んが一番自然なスタイル…

キャラ運用メインが最も王道かつ効果的か。公式もかなり補足してくれるので拡散が期待できる。

基本的にギャグ要員という設定がついている。でも純粋にかわいさを押し出した動画も好き。

No.7

大人のお姉さんボイス。スタイルごとに声質が全く違う。
扱いやすさはいまいち。おすすめは読み聞かせスタイル。

用途はお好み。歌える(Neutrino)。立ち絵が少ない。エゴサはしづらい。

プロ声優がCVなためか、商用利用に制限がある。それ以外の規約はわりとゆるめ。何気に公式タグがある。
服装と体型、子供好きという設定が災いしてか変態として扱われやすい。公式に迷惑のかからないように。
お気に入り。

櫻歌ミコ

アニメ幼女ボイス。CVが古株なためか、声の扱いやすさは最高レベル。
スタイルもあるが少し癖強。ピッチで感情表現可能。

キャラもCVもなんでもござれ。歌える(UTAU)。公式もそれなりに動いている。作画コストの低さがウリなため、素材も多い。

テトと同じくVIP発祥なので古参ファンが多い。名前の櫻(おう/さくら)は間違えてほしくないとのこと。公式がR18を推奨している。
二次創作をする際は、同プロジェクトのVtuberと混同しないように注意。

小夜/SAYO

清純幼女ボイス。最近アップデートで舌足らずが改善された。
それなりに扱いやすい。

CVとしての利用も人気が高いが、キャラ運用も十分いける。公式はよく動く。


櫻歌ミコの運営と仲が良く、コンビを組ませて『さよみこ』として出すことで拡散効果が実質倍になる。
ソロで出す場合は『さよち』等でも拾ってくれるが、エゴサが大変らしいので公式タグが確実か。

ナースロボ_タイプT (TT)

ハスキー少女ボイス。スタイルも豊富でささやき持ち。かなり安定して運用できる。少しだけ訛りがあるので気になる人は直しておこう。

隠れファンが多いため、キャラ運用がやりやすい。立ち絵も汎用性が高い。
暗いテーマの動画かASMRと相性がいい。
CV&運営さんの都合により、今後公式で何か起こる可能性は低い。


センシティブな作品に使われがちだが、TTの音声はR18利用禁止である(イラスト等もアウトだと思われる)。
さらなる音質(主にささやき)を求める場合、COEIROINK版の音源が適している。お気に入り。

猫使アル

低めの少年ボイス。安定度はまちまち。スタイルを変えてもあまり声が変わらない。おちつきは多少扱いづらいため、ノーマルのままピッチを下げるとうまくいく。

キャラ運用もできるが、CVもいける。固定ファンもそれなりにいる。

少年ボイスとは言うものの、性別は自由。それ以外の設定も自由。お気に入り。

猫使ビィ

高めの萌え声。こちらはスタイルでの変化が顕著。人見知りは扱いが難しいか。

キャラ運用が強い。コンビでもいいが、固定ファンはアルより多いのでソロも可。

こちらも設定の解釈は自由。
なお猫使共通の規約として音声のみのR18利用は禁止。それ以外は可。
中の人はそこそこ名のあるVtuberで、V側の視聴者も流れてきている。
公式はほとんど動かない。

中国うさぎ

超ダウナー系少女ボイス。意外と素直。スタイルも使い勝手がいい。

キャラ運用が強い。固定ファンも存在しかつまだマイナーなので、新規を開拓できるかも。

最近徐々に人気を獲得している。マイクラ動画でよく見るようになった。

満別花丸

マスコット系ボイス。スタイルはそれぞれ全く違う声質でささやき持ちだが、一部文章が発音できなかったりと欠点もある。

キャラ運用もいい。今のところはCV運用が吉か。公式はそこそこ動く。

規約がかなり自由で、公式側から素材がたくさん用意されている。寂しくなったら中の人が配信をしている。

琴詠ニア

正統派お姉さんボイス。一見素直そうだが、調声難易度は鬼。ちょっとでもピッチを見誤ると声が裏返る。でもいい塩梅に低くすると包囲力のある声に化ける(一番近いのはNo.7の読み聞かせスタイル)。

キャラ運用が不可能に近い。公式がおらず、運営も一切宣伝しない。コンテンツの供給が圧倒的に不足している。

ボイボメインで使いこなすのは非常に難しい。どうしても応援したいなら運営からボイチェン&配信ソフトが配布されているので、そちらでもよい。
自分の調声技術を試すのに使える。お気に入り。


雑記

課題はやっぱり合成音声の幅広い認知。
現状クレジットが全くない動画や、危ないことに使われている動画も数多くある。ニコニコでは例のアレあたりが当てはまるし、Youtubeやインスタ等の場所でもそう。
特にVOIVEVOXは無料という点が祟ってより過激になっている。
かといって普通に使ってるファン層も健全な使い方してるかと言われたらそうでもない。合成音声はセンシティブ方面で過激になる傾向がある。
ニコニコだけでなく、Youtubeのファン層とも交流するような何かがあれば中和されて広がってくれるかも。

もしくはわかりやすい規約。
調べたところ、利用規約を読まずにサービスを利用する人は7割超えらしい。私も合成音声以外だったら読み飛ばしてる。
何かしらの方法で読ませるのがいいのかな?とも。
例えばTALQuは『了解ボタンがフェイクで、本当の起動法は規約内』というスタンスだったが、毎回同意してるとさすがにめんどくさいが勝った。
個人的には利用規約のざっくりとした要約があるとかなり助かったので、初回DL時等に簡易的なポップアップとして表示するのがいいんじゃないかなぁと思う。

無料かつUIが他ソフトに似ているため、合成音声入門として非常におすすめできる。とりあえずこれで相性を試して、気になったら有料のものも買うといいかもしれない。


この記事が気に入ったらサポートをしてみませんか?