見出し画像

生成AIで音声入力を使う

聞いた。

けんすう氏は生成AIと音声入力を組み合わせて、わずか15〜20分程度でポッドキャストの台本を作っているらしい。考えたことを音声入力で気軽に吐き出し、それを生成AIに整理させる。この手法を聞いた時、「この手があったか」と思った。

実のところ、以前から音声入力には興味があった。勝間和代さんあたりが「手入力より圧倒的に早い」と推していて、試してみようかと思ったことがある。でも、実際やってみると上手くいかない。普段からテキスト入力で考えを整理する習慣がついているから、まとまった文章を話すのが難しいのだ。専門用語を正確に入力したい時に、音声認識の精度で引っかかって何度も修正が必要になる。そんなことを考えると、結局「慣れたキーボード入力のほうが楽だな」となって、すぐに諦めてしまった。

ところが、ハイパー起業ラジオで紹介されていた音声入力と生成AIの組み合わせを知り、考えが完全に変わった。生成AIは多少の誤字脱字があっても、不完全な入力であっても、文脈を理解して適切に補正してくれる。完璧な音声入力を目指す必要がないのだ。思いついたことを気楽にしゃべって、それを土台にAIが整理してくれれば良い。

悔しいことに、俺はChatGPTの会話モードでは似たようなことをやっていた。散歩しながらアイデアを話して、それをまとめてもらったり、旅行中の体験を語りかけて記録を作ってもらったり。でも、それを会話モード以外で使うという発想がなかった。「会話以外の深い考察には向かないんじゃないか」とか「プロンプトの入力欄に音声で入力するなんて」とか、妙な思い込みがあった。

ここから先は

767字 / 1画像
この記事のみ ¥ 100

人に対し何かをしてあげるという事は、全て「見返り」を期待しての行為だ。noteのサポートは文章を読むための「見返り」である。