生成AIと文字起こしツールを活用したブログ記事作成術 ~LIFULLの取り組み~
この記事では、LIFULLの取り組みとして紹介した下記のブログ記事を作成する際に活用したプロセスをご紹介します。
日々の忙しい業務の中で、ブログ記事を書く時間を作るのに苦労している方も多いのではないでしょうか。この方法を使えば、負担を軽くしながら効率的に情報発信を進めることができるかもしれません。ぜひ参考にしてもらえると嬉しいです。
記事作成の流れ
記事を効率的に作成するためにどのような手順で進めたのか、具体的なプロセスをご紹介します。
1. MTG録画の実施
ブログ記事の元となるのは、チームで開催されたMTGです。このMTGでは、半年間の振り返りを行い、成果や課題、次に向けたアクションプランなどを話し合いました。これらをすべて録画し、後から議論の内容や流れを振り返るために活用します。
2. Whisperによる文字起こし
録画した内容をWhisperで文字起こしします。Google Colab上でWhisperを実行することで、手軽に文字起こしを進めることができます(具体的な操作方法についてはこの記事では触れませんが、関連情報は他の記事で多く紹介されています)。文字起こし自体は瞬時に完了するため、非常に便利でした。
3. 生成AIで記事の叩き台を作成
文字起こしされた資料を、自社開発の生成AIに入力します。このAIは、文字起こしされたデータをわかりやすい文章にまとめ、主題に沿ったブログ記事の叩き台を作成してくれます。
4. 人の手による編集
AIが生成した叩き台を人間が確認し、追加修正を行います。これにより、記事内容の正確性を確認し、違和感のある箇所を修正します。また、ブログ記事としての読みやすさや構成を調整し、仕上げていきます。
5. 公開への準備、そしてリリース
最終的な記事が完成したら、note上で記事の下書きを作成、レイアウトやデザインの調整を加えました。また、記事に合わせたメインビジュアルを作成し、社内レビューを経て公開しました。
注意点と対策
このプロセスを進める中で注意が必要だったポイントと、それに対する具体的な対策をまとめました。スムーズに進めるための参考にしてください。
1. 録画データに無音区間がある場合
無音区間があるとWhisperが正常に処理できない可能性があります。そのため、MTG時にはなるべく無音時間を作らないように心掛けるか、動画ファイルを編集して無音区間をカットする必要があります。
無音区間がある場合は、下記のような文字が出力されたりします。
2. Whisperでは話者分離ができない
Whisperでは基本的に話者分離ができません。そのため、MTG時に各参加者が自分の名前を名乗ってから発言するようにしました。これにより、文字起こしに発言者の名前が残り、自社開発生成AIでの記事作成時にその情報をプロンプトとして活用することで、発言者を区別し、対談風の記事に仕上げることができました。
3. 一度に長い文章を扱えない
ChatGPTもそうですが、自社開発のAPIも文字数の制限があるため、あまり長い文章を一度には生成できません。そのため今回は予めブログ記事全体の構成を自分で考え、段落ごとに記事を作成しました。(ここはもっと上手いやり方がありそうです。)
生成AIの活用で感じたメリット
生成AIを使うことで、記事作成がどのように変わったのかを振り返ります。効率化や新たに得られた発見についてお伝えします。
1. 記事作成の効率が上がった
話した内容をそのまま記事化する流れを作ることができ、コンテンツ制作がスムーズに進みました。作業全体の効率も大幅に向上しています。
2. Whisperの誤字も生成AIが修正してくれる
Whisperは完璧ではなく誤字が含まれる場合もありましたが、生成AIを活用することで、それらをすべて補正しながら記事の叩き台を作成できたため、大きな支障はありませんでした。
3. 話し言葉を文章化する難しさを解消
話し言葉を記事として整った文章にするのは意外と難しい作業ですが、それも生成AIが行ってくれるため、とても楽になりました。
結論
文字起こしツールや生成AIを活用することで、記事作成の負担を大幅に軽減しながら、効率的かつ質の高いコンテンツを作成できることが分かりました。特に、AIによる叩き台作成と人手による微調整を組み合わせることで、スピードと正確性の両立が可能になります。今後もこのプロセスを改良し、より多くの人に役立つ情報発信を目指していきたいと思います。