見出し画像

文字起こしアプリ内で、要約や議事録の整形・Q&Aまで。UXへのこだわりをまとめます

みなさん、こんにちは!

「無限もじおこし」をリリースしてからしばらく経ちましたが、今回はちょっと自信を持ってアピールしたい新機能を追加しました。

その名も「AI変換機能」です(そのまんまです)

文字起こしデータをChatGPTにコピペして議事録として整形したり、質問や要約に使っているという声をSNSや、ユーザーアンケートでも多く見かけていたので、とてもリリースするのが楽しみでした!

この記事では、「AI変換機能」の概要と、かなり使いやすさ(UX)にこだわりましたので、そのお話しをしていきたいと思います。

ちなみに「無限もじおこし」については、以下にまとめてます!




「AI変換機能」とは?

今回のアップデートで追加された「AI変換機能」は、文字起こしデータをもとに、要約したり、議事録形式に整形したり、さらには質問もできるというものです。

「文字起こしをした内容を、そのまま使う」という方、少ないんじゃないかなと思います。実際、これまでも「無限もじおこし」で文字起こししてから、それをコピペしてChatGPTに投げて整形してるよっていう声が結構ありました。

なので、この一連の流れをアプリ内だけで完結できたら最高だなという思いから、「AI変換機能」の開発を始めました。


文字起こしデータを即座にチャットへ

まず特筆すべきなのが、ワンタップで文字起こしデータをAIのチャット画面に読み込ませることができる点。これによって、わざわざコピペする手間がゼロになりました。

アプリを跨ぐと大変ですよね…

具体的には、文字起こしページの右上に「AI変換」ボタンを追加しています。このボタンを押すと、開いているページの文字起こしデータをGemini 1.5 Flashに裏側ですべて入力し、すぐにチャットがスタートできる仕組みです。

ここで言う “入力” とは、Gemini 1.5 Flashへ渡すプロンプト(インプット情報)の中に組み込むという意味です。また学習データとして利用されるわけではありませんので、ご安心を!

「無限もじおこし」の全てのデータは、AI学習されません

よく使うプロンプトをワンタップで呼び出せる仕組み

もう一つの大きな目玉は、“よく使う指示(プロンプト)”をボタン一発で呼び出せる機能です。

事前に2つ用意しました!カスタム追加も勿論できます👌

チャット画面の上部に横スクロールのボタンを配置していて、「要約する」「議事録に整形」など、あらかじめセットされたボタンをタップするだけで、そのプロンプトが入力されるようになっています。

もちろん、自分がよく使う独自プロンプトをカスタム追加することも可能です!「何回も同じ指示を打つの面倒だな〜」を解決するための工夫ですね。

議事録作成とか同じフォーマットで出力すると思いますし、結構使うシーンは多いじゃないかなと思ってます(ぜひ試してご感想ください!)


“チャットUI”のこだわりポイント

「AI変換機能」とはいえ、実際に使う場面ではチャット形式が便利だと考えました。要約や整形だけでなく、「○○について何て言ってたっけ?」みたいな質問もできるので、何でもOKな自由度の高い形式にしています。

また、先ほど上記で記載した、指示をワンタップで呼び出したときに、指示内容が長文すぎてチャット画面が見づらい問題がありました。

そこで、タイトルだけ表示するアコーディオン形式を採用して、中身の長文はユーザーが見たいときだけ開く設計にしたんです。

些細な点ですが、推しのこだわりポイントです

こうすることで、画面をスッキリ保ちながら、必要なときに詳細を展開できるようになっています。


RAGを超えるロングコンテキストの精度

技術的な話をすると、今回の「AI変換機能」はいわゆるRAG(Retrieval-Augmented Generation)的な、ドキュメント検索ベースのアプローチとは違う手法を使っています。

RAGは関連する文字起こしの部分だけ引っ張り出すのでトークンコストが削減できるメリットがある反面、情報が欠落してしまうリスクがあるんですよね。

そこで、Gemini 1.5 Flashのロングコンテキストを活かして、あえて文字起こし内容を全部一気に読み込ませる“ゴリ押し”戦法を採用しました。

これ、結構精度が高いです。インプット情報の漏れがなくなる分、きちんと要約してくれたり、さまざまな質問や要望にも答えてくれたりします。

その分、入力情報が増えるのでコストは高くなってくるんですけどね…笑


価格と利用制限について

さて、気になる価格面ですが、とはいえ今回利用しているGemini 1.5 Flashはトークン単価がかなり安いので、結構思い切ってます!

  • 無料ユーザー:月5回までAI変換が可能

  • 有料ユーザー(月額500円):"無制限"で利用可能

これまでのサブスク特典といえば、広告非表示や音声ファイルインポートくらいでしたが、今回そこに“AI変換機能の無制限利用”も加わりました。

1か月500円で使い放題できるなら、かなりお得じゃないかなと思ってます。
※もちろん、文字起こしも無制限ですよ!

興味を持っていただけたら、まず無料枠でお試しいただき、ガッツリ使いたいと思ったら、ぜひ応援の意味も込めてサブスク購入していただけると嬉しいです!



まとめ

というわけで、今回「無限もじおこし」に新しく加わった「AI変換機能」についてまとめてみました。

  • 文字起こしからワンタップでチャットへ飛べる快適さ

  • よく使うプロンプトをワンタップで呼び出せるお手軽さ

  • ロングコンテキストをフル活用した高精度な変換

  • 月5回まで無料、サブスク(月額500円)だと無制限のコスパ感

個人的に使ってみて、「もうコピペに戻れないな…」っていうのが正直な感想です。今後もユーザーの皆さんの声を拾いながら、もっと便利にアップデートしていきたいと思っています!


余談

ちなみにこの記事はo1 pro modeがほぼ書きました!

人間の僕がやったのは、話したい内容を箇条書きでつらつら雑に書いたのと、以下の記事を文体として参考にしてね〜と指示を出した程度です。

あと画像とかキャプションは流石に自分で作ってます笑
文章を変えたのは3箇所くらいですかね。

「やるやん!」って思いました!👏

いいなと思ったら応援しよう!