見出し画像

[kintone] にじボイスで「ひと目でわかる主なアップデート」

こんにちは、キン担ラボの本橋です。

本橋です

クライアントさんに向けて「一目でわかる主なアップデート」をお知らせするようになり、それを対話形式で解説するAIポッドキャスト化する実験を進めています。今回のnoteはその進捗です。


「にじボイス」でkintoneの主なアップデート

なんといっても「にじボイス」の力がすごいですね。声優による読み上げがAPI経由で使えるとか夢物語かと思ってしまう。

作成した対話動画はこちらです。にじボイスの力でだいぶ自然な音声になりました。画像もSoraを使って動画化しています。これが全部無料というのが信じられない…

試作ツールの公開

今回使用したpythonスクリプトをgithubに公開しています。

使い方

main.py をそのまま呼び出すと使用方法を出力します。

$ python main.py
使用方法: python script.py <input_json_file> <output_folder>

冒頭の動画に使った音声は、サンプルで同梱した12月.jsonを使って以下のように実行しまました。

$ python main.py 12月.json dialogue

jsonの話者の名前は手抜きしてハードコードしてしまっています。
生成されたJSONに合わせて[mp3_generator.py]のコンストラクタを書き換えてください。

class MP3Generator:
    """
    JSONデータからMP3ファイルを生成する機能を提供するクラス。
    """
    def __init__(self, config):
        self.config = config
        # speakerとEnvConfの定数のID_CHAR_01の対応を定義する辞書
        self.speaker_id_map = {
            "武士": self.config.ID_CHAR_01,
            "運転手": self.config.ID_CHAR_02,
            # 必要に応じて他のスピーカーとIDを追加
        }
(後略)

jsonの作り方

ChatGPTに渡したプロンプトです。


### 命令

「以下のアップデート内容を基に、対話形式のテキストを作成してください。
対話は以下の形式です:  
- 1行目にお姉さん(運転手)の発言、2行目にお兄さん(武士)の発言を書く。
- 3行目にお姉さん(運転手)の発言、4行目にお兄さん(武士)の発言を書く。
- 必要な回数だけ繰り返してください。

### アップデート内容:

[キン担ラボ] 11月の主要なアップデートのお知らせ

✅ [アプリ] 設定 アプリのメンテナンスモード

アプリの変更途中で誰かが入力しないようにガードする機能です。kintone担当者向け機能ですね!


✅ [API] アプリ設定 インライン編集の取得・更新

APIからレコード一覧画面でのインライン編集の取得と変更が可能になります。UIをカスタマイズしている場合は要チェック!


✅ [全般] UIデザイン フロントエンド基盤の刷新

アプリストアの画面が新しくなりました。レイアウトも変わります。


✅ [全般]  その他のアップデート 共通管理で組織一覧をスクロール

cybozu.com共通管理で組織一覧をスクロールできるようになります。



メンテナンスモードはアプリの管理者にとっては「これだ!」という機能ではないでしょうか。アプリ単体の変更であればアプリの動作テストを使えば済む場合であっても、複数アプリが絡んでくるとそう簡単には行きません。こういう機能があるよ、ということは覚えておいて損はありませんね。

来月もお楽しみに!



### 出力条件:
- 「候」「心得」などの難しい言葉をひらがなに変換する(例:「候」→「そうろう」)。  
- 対話を1発言1ノードのJSON形式で出力する。
- ノードにはspeakerlineを持たせる。
- すべてのノードは、dialogueノードの子要素とする。

[12月.json] と同じような構造を持ったjsonが出力されれば成功です。

うまくいかない場合はプロンプトを調整したり、apiのjson modeを使ったりしてみてください。

今後の自動化構想

「主なアップデート」をChatGPTのAPIに投げて対話JSONを作るところまではできました。そのまま音声化しても良いのですが、見ていると若干手を加えたくなる発言もあります。

ということで全自動化はしないで、JSONを作る部分と、編集後のJSONを投げたら音声化したMP3ファイルがダウンロードできる部分をそれぞれWebサービス化すると手軽に扱えてよいかなと考えています。

以前メルマガをポッドキャスト化するWebアプリを作って、それは今も毎週便利に使っています。そこと合流させると良さそうです。

最後までご覧いただきありがとうございました!


いいなと思ったら応援しよう!