ディープラーニングでボイスチェンジャーを作る人たちのDiscordサーバーを作った
みなさんこんにちは初めまして。YUzushioと申します。
今回は創作+機械学習 Advent Calendar 2021
の16日目の記事としての投稿です。(遅れてすみません)
タイトルの通りですが、ディープラーニングでボイスチェンジャーを作る人たちのためのDiscordサーバー「Open Virtual Voice Lab. — OV2L」を作りました。読み方はシンプルに「オーブイツーエル」です。
参加はこちらから。
作った動機
作ったきっかけは私が足掛け3年ぐらいファンとして応援しているプログラマーヒホさんの「声質変換のディープラーニングやってる人同士の交流できる場所ほしい」というツイートでした。
なるほどな?と思い40秒でサーバー名を決め2分でDiscordサーバーを作り40秒でロゴを作って開設しました。勢いしかない。
憧れの人とやり取りできるって思うとめちゃくちゃパワーがでる。創作や声質変換を考えている人はみんなそれぞれのあこがれに向けて突っ走っている感があって作品を見るたびにパワフルさを感じれて元気をもらえます。
OV2L・・何をやってるの?
サーバーとしての目的は「声質変換(主に機械学習やDLなど)に関する研究を行われている(趣味・仕事は不問)方同士の交流の場として和気あいあいと意見交換をしていきたい」というところです(サーバー内説明抜粋)。
その目的に沿って「作ったものを披露する」「最近見つけたものをみんなに共有する」「最新論文のアプローチ方法をみんなで議論する」「新しいアプローチ方法を考えてみる」ということをやっています。どちらかと言うとエンジニアリングよりも研究に比重が寄っています。
月に一回の「論文読み会」
代表的な活動としては月に一回の「論文読み会」があります。もともとは月に一回の「勉強会」でしたが、最近は論文を読みあう場所に変わりました。毎月誰かがピックアップしたい論文を持ってきて解説。
参加者も全員論文を読んできてから参加してわからないところをお互い補い合いながら提案手法のディスカッションをする場です。
発表されてから2週間くらいの論文を取り上げたりもするので情報が早いしわかりやすい。そしていろんな角度からアプローチに対する検証がされているのでとても勉強になります。
過去に論文読み会(読み会)で取り上げたテーマを一部並べてみました。主催してくださった方のお名前も記載しています。
CycleGAN-VC3 : tosakaさん
VAEとVQ-VAEについて0から勉強する会 : 天王洲アイルさん
ベイズ推論について勉強する会 : 天王洲アイルさん
NoiseVC: 天王洲アイルさん
VITS: kaffelunさん
StarGANv2-VC : tosakaさん
wav2vec2.0: kaffelunさん
UnitNet-Based Hybrid Speech Synthesis: 天王洲アイルさん
Glow-TTS: kaffelunさん
Fre-GAN: 天王洲アイルさん(2021/12/25 21:00~開催予定)
もくもく会
2021年9月から、毎週土曜日14:00-16:00にもくもく会を行っています。時間がある時に集まって適当に喋りながら自分の作業を進める、そんなのんびりしたスペースです。なんならDL関係ない作業をしている人もちらほら。1人でやる気が出ない時は是非いらしてください。同志が待ってます。(たぶん)
オンラインイベント 「OV2L Evolving Summit 2022」
もくもく会の会話の中で出た「論文読み会以外にも何かしたく無いですか?」という意見から勢いで作ったオンラインイベント企画です。日頃の研究成果を発表して褒め称え合う場にしたいと思っています。
当日はDisocrdのボイスチャットで行います。YouTube Liveもやる予定。
2022/1/30(日)11:00-17:00の開催となります。
ティザーサイト(絶賛建築中)はこちら。
登壇者用申込みフォームはこちら。
2021/12/16現在、登壇者枠はまだまだ空いております。登壇資格は「申込時にOV2Lに参加している人」だけですので、この記事をご覧になった方もサーバーに参加して奮ってご登壇ください。
さいごに
この記事をご覧下さりありがとうございました。この記事を見てOV2Lに参加してみたいと思ってもらえたら幸いです。サーバー管理者として、いつかOV2L出身のツールや企業が出てくれるといいなと夢見ています。次々とサービス事例が増えてくる声質変換周りの機械学習界隈、この機会にあなたもディープでホットな技術の海に飛び込んでみては如何でしょうか?
それでは。