見出し画像

SlackにChatGPTアシスタント入れたら、生産性が爆上がりした件

以下、Open AIのWhisperで文字起こししたデータをChatGPTにそのまま突っ込んで、軽く編集して、公開してみた記事の実験です。

最後に、この記事書く際に学んだことなど記載します。


Slackにですね、ここ最近ChatGPTとWisperのAPIを提携しています。

基本的にSlackが公式で連携をしてくれるような声明を出しているんですが、ただ、現段階においてはまだ利用できない状態になっていたので、Node JSでChatGPTというか、APIエンドポイントのcreateChatComplettionのエンドポイントですね、whisperのcreateTranscriptionかな、のエンドポイントを叩けるように実装しました。

具体的な仕様としては、最初にChatGPTをメンションに入れてコメントを投稿するとですね、そのChatGPTがそのスレッドに対して回答してくれるような機能が一つと、あとはそのSlackの純正の機能で音声ファイルを添付することができるんですけど、音声ファイルをですね、そのままSlackに投稿すると、そのスレッドに対して文字起こしした結果を返してくれるような機能を作りました。

結構シンプルな機能なんですけど、ユースケースとしてはかなり色々あるので、あってかなり便利だったので、ちょっとそれについて紹介したいと思います。

ユースケース1: 自分との対話がやりやすい

まず一つ目のユースケースとして、自分との対話がものすごくやりやすくなったというところがあります。もともと僕自身が経営者だったりとかプロダクトマネージャーというか、仕様をゴリゴリ書いたりするポジションにいるんですけど、その、なんていうんだろうな、仕様作成とかをするのにですね、結構そのドキュメントとかノーションに向き合う時間が今まですごく長かったんですよね。

Notionの文字と向き合うことで、さらに思考を深くしてというようなプロセスを踏むことが多かったんですけど、今のフローだと、Slackのスレッドにタイトルつけて、その後にですね、今みたいなSlackの音声ファイルをですね、投稿して、文字起こししてくれるんですよね。

ただ、文字起こしって基本的にはチャットGPTで、Whisperで出されるんですけど、あんまり改行されてなかったりとか、誤字脱字があったりとか、ウェブ上で見えるフォーマットにはならないので、それを上からチャットGPTに指示してあげるとですね、普通に話している内容がブログ風の文章に変更してもらえるような感じになるんですよね。

これがですね、できると結構強いのがですね、普通に話したことがそのまんま表示されるところなんですよね。それを見てさらに音声ファイルを追加して思考を深めていくみたいなことができるので、結構一人で何かをガーッと考えるときとかに、スレッドをずっと眺めているだけでセルフコーチングできるというところがかなり強さというか魅力があると思っています。

メリット②:議事録作成がいらなくなり、リモートワークの同期性が上がる

2つ目のメリットとしてですね、コミュニケーションというか議事録を書く時間がなくなったというところですね。

今はちょっと会社の状況的にオフィスとリモートをハイブリッドにしている状況になっているんですけど、オフィスで話した話ってかなりちゃんと明確に運用しないとですね、そのログが残されないまま話が進んでしまうというのがあって、リモートで働く人からすると結構不便になるんですよね。

それがこのシステムを入れると、結構ログ残すのが簡単で、あれなんですよね。基本的に話している内容を録音しましょうと録音して、Slackにボンと投げるだけでまず文字に起こしてくれて、「議事録のフォーマットに残して」も終わりなので、リモートとの同期性というのをコストを払わずに上げられるというところが大きなメリットになります。

ちなみに仕様書だったり、バグ報告書に変更することもできますね。なので話しているプロセスを音声入力で先にして、最後に出力フォーマットを指定してあげれば、基本的には誰もが情報を追うことができるような状態になるというところがもう一つのメリットかなというふうに思っています。

メリット③複数人の議論にChatGPTを入れることで、議論を広げられる

さらにいいところはですね、Slackというインターフェースのおかげというところもあるんですけど、基本的にChat GPTって一人が利用する想定に今のところなっていると思うんですよね。

具体的に言うと純正のチャットGPTアプリを使って、個人がそこにコミュニケーションするという形になるんですけど、ストラックのインターフェースって基本的に1対NというかN対Nというか、複数人の人が見るようなインターフェースになっているんですよね。

Slackのスレッドも実は一人じゃなくて複数入れるので、例えばスレッド間でコミュニケーションした内容の要約だったりとか、Chat GPTにスレッド間でコミュニケーションしている話を要約させて、より多くの質問を出させたりとかですかね。例えば仕様書に関してはこれ以外で不足している点ありますかみたいな質問をすることができる点はかなり魅力的だなというふうに思います。

メリット③チームでプロンプト学習がしやすい


あともう1個メリットとして、プロンプト教育が結構しやすくなるというところですね。

これはインターフェースの話にもまたつながるんですけど、基本的にChat GPTってプロンプトを1人でいじっていることになるので、誰がどういうプロンプトを叩いているか見えないんですよね。誰がどういうプロンプトを叩いているか見えないと、いいプロンプトを学習する機会がないっていうのがあります。

一方でスラックにAPI連携していられると何がいいかというと、他人の書いているプロンプトでうまく言っているやつしているやつが分かるんですよね。

あとはうまくいっているプロンプトの一部を、例えば他の人が学習して使ったりとか、あとプロンプト叩くの苦手な人に関して、フィードバックしたりとかできると思っています。プロンプトに関しては、最初から叩ける人は叩けるし、叩けない人は叩けないと思っていて、これはプロンプトの能力とはまた別に、指示を出す力だったりとかが必要になってくるものなんじゃないかな、というふうに思っているんですけど、そういうところを見て、チャットGPT活用できるんだっけみたいなところが、総合的に判断できるのは結構強いんじゃないかな、というふうに思っています。


以上ここまでが音声録音したものを、文字起こししてそのままChatGPTに投げた感じの記事です。

AIがやったこと:

  • 文字起こし

  • 段落分け

  • 誤字脱字修正の一部

人間がやったこと

  • 見出し作成

  • 誤字脱字修正の一部

  • 固有名詞の修正

  • リスト形式への修正

  • 鉤括弧を入れる

  • 不要な行の削除

  • リズム感を出すための改行

  • 関連URLの追加

学び

  • 一発ドリのテキスト化なので、見出し構造とか先に決めておかないと、話が冗長になってやはり編集が必要になる

  • 段落のリズムとか、さすがにそこまでは難しい。編集者がいる。

  • リスト形式の表示とかも、ここはリスト、ここはリストではなくてもいい、みたいな判断が編集者の感覚によるもの感を感じる

  • 固有名詞に関しては、日本語がそこまで強くないので、英語表記するものがひらがなになってしまったりする。ただ一斉置換すればさほど編集は大変ではない

  • ChatGPTの記憶容量的に、リクエストで一発で文字起こしデータを編集させるのは困難。この辺のペイン解決して記事かけるプロダクトあるとよさそう。

サポートでいただいたお金はFanzaの動画を購入するために利用されます。