声質変換サービス『One's Voice（α版）』を公開しました！

田村一起/(株)voiceware CEO

2020年3月28日 23:35

かなり久しぶりの更新となってしまいました・・・！

で、更新ができていなかった間、どうしていたかというと、
自社サービスの開発に勤しんでおりました。

その甲斐もあり、ようやくサービスのα版公開できました！！

サービス名は、『One's Voice』
当社のサービスということは当然、声質変換のサービスです。

折角なので、特長やα版の使い方を紹介したいと思います。

声質変換とは？

まずは、声質変換って何？という方のために、簡単に説明すると、
「話す内容はそのままに声質のみを別の人の声質に変換する技術」です。

要は、高性能なボイスチェンジャーと思ってください。
（名探偵コナンの蝶ネクタイ型変声機をイメージしていただくと良いかも。）

変換したい声質の話者（目標話者）の音声データを事前に登録しておくことで、任意の音声データを登録済みの話者の声質に変換することが可能になります。

スクリーンショット 2020-03-28 22.20.52

One's Voiceの特長は？

声質変換技術を使ったサービスも増えてきましたが、One's Voiceと他サービスの違いは一体何なのか？

大きな違いは、目標となる話者の音声データの準備が容易なことです。

従来技術だと少なくとも10分程度の読み上げ音声が必要だったところですが、One's Voiceでは最短5秒で、しかも話す内容は何でもOKです。

その分、変換品質にまだ課題はありますが、それも徐々に改善していく予定です。

まだリアルタイム変換は実装していませんが、夏頃にはそちらも対応予定です。

どんな事に使えるの？

One's Voiceの特長は何といっても手軽さ。
一番活躍できる場面は、「失くなった声を再現する」ことだと考えています。

例えば、喉頭癌等で声帯を失ってしまった人たちは、発声することができなくなってしまいます。

そういった方々も、特別なデバイスを用いたり、あるいは特殊な発声方法を習得する事で喋ることはできるようになります。

しかし、元々の声は失われたままです。

従来技術でも、音声合成によって元の声を再現する取り組みはされていました。
しかし、大量の音声データが必要となるため、なかなか一般の方が利用するには難しい状況です。

そのような場合でも、One's Voiceがあれば、昔の音声データさえ残っていれば、元の声を再現することができると考えています。

他にも、亡くなってしまった方の声を再現することもできます。
倫理的な問題があるので、取り扱いには注意が必要ですが。

また、声質変換というと、VTuber向けやエンタメ領域に応用を考えられることが多いです。
もちろん、そういった用途に活用することも可能です。

どうやって利用するの？

One's Voiceでは、APIを提供しています。
α版は無料で利用できますが、アクセストークンが必要になるため、利用したい方はまずはお問い合わせください。

利用するために、やや専門知識は必要になりますが、
・curlを使ってリクエストを送信する
・音声データを対応可能フォーマットに変換する
くらいのことができれば問題ありません。

アクセストークンが発行されたら、声を変換するために必要な作業は、たったの３ステップです。

1. 目標話者の音声データを登録する

私は、Postmanというツールを使っています。参考までにリクエストの画面を。

スクリーンショット 2020-03-28 23.14.59

2. 目標話者を指定して、変換したい音声データを送信する

スクリーンショット 2020-03-28 23.20.07

3. 数十秒〜数分待って、変換された音声データをダウンロードする

スクリーンショット 2020-03-28 23.21.27

これだけです。

で、田村の声を女声に変換してみた結果がこちら。

・元の声

・変換された声

うーん、、、まだまだ改善の余地ありって感じですね・・・！

α版ということでそこはご容赦ください。。品質は引き続き改善していきますので、暖かく見守っていただければと思います！

興味ある方は是非お気軽にご連絡ください！

株式会社voiceware
代表取締役CEO 田村一起
https://voiceware.co.jp/