おふとんP

おふとんP

最近の記事

ITAコーパスを用いたTALQuモデル生成手順がきたのでやってみる

ITAコーパスが発表されましたね。パブリックドメインというのは実に良いものです。 そして今までの声優統計コーパス利用ではなく、ITAコーパス利用の学習用ノートが出てきましたね。 では今回も解説していきます。 1. OREMOとITAコーパスのリストを用意するDAWなどでまとめて録音する方法、OREMOで1文ずつ録音していく方法があります。2つ試した結果、変換とか再録の都合上OREMOがめっちゃ楽だと感じたので今回はそっちの解説をします。まとめて録音→切り出しについては前記

    • TALQuモデル生成手順が来たので、ust書き出しでもやってみる

      ustから生成する方法についても、楽にやれる方法を模索してみました。 調声すら省くので、かなり簡単に生成できるはずです。 あとはPCがついてこれるかどうかだけ。 とりあえず、いってみよう。 0.音源を準備する好きな音源を用意してもらって構いません。 が、条件はあります。 ・原音設定が適切にされていること(ずれたりしていない ・ust書き出しにおいて不足音素がない ・ノイズが極力少ないこと この3つです。 ノートブックのほうでは、使用するUTAU音源の、原音設定の左ブランク

      • TALQuモデル生成手順が来たので、敢えて生声でやってみる その2

        ご要望が割と多かったので、学習手順についても書いてみる。 と言っても、動画で触れられていたことの焼き増しというか引用になりそう。一応自分なりにまとめてみる。 1.準備した学習用データを自分のGoogleDriveにアップする当たり前の話なんだけど、Googleのアカウントがないとなんともならない。 ついでに、GoogleDriveの空き容量はそれなりに必要で、生成した学習データは学習200回ごとに300MBオーバーのファイルが一つずつ増えていくことになる。容量を他で圧迫して

        • TALQuモデル生成手順が来たので、敢えて生声でやってみる

          最近の機械学習系はアツいですね。 動画の中では、ustを一つ一つ書き出したものを学習させることで生成していました。373ファイルを全部書き出すのは心が折れそうです。 そして、「生声と置き換えすることは可能である」ことも言及されていました。 全て自己責任、というやつなので、それならば。 やってみようじゃあ、ないか。 1.声優統計コーパスを録音する。詳細はこちら https://voice-statistics.github.io/ ここにある100文を録音します。 普通に