
【続】AIで文字起こしを自動化すると議事録作成の生産性がどのくらい高まるか?
前回は、torunoというツールを使って3時間超の会議の音声をAIで文字起こししてみた、というところまで書きました。この文字起こしを議事録に仕立てて完成させたのですが、最終的にどのくらい効率化できたのかを検証したので、今回はそのあたりを書いていきます。
議事録作成の担当部分を分ける
前回も掲載しましたが、下のイラストのような会議があったとして、その音声文字起こしを2人で分担したので、私の担当した部分は黄色く色を付けた部分になります。

この時はまだ文字起こしツールtorunoを使っていなかったので、すべて人力でやっていました。また、文字起こしにtorunoを使った会議も同様に次第を色分けしてみました。ちなみに、この時点ではもう一人の担当者はまだ私がAIツールを使っていることを知りません。

この2回の会議で、それぞれ議事録の作成にどのくらいの時間がかかったのかを算出して、ツールの効果を測ろうというわけです。
議事録作成にかかる時間など計っているわけがないが…
しかし、議事録作成にかかった時間は正確には分かりません。なぜならそんなもの計っていないからです。そこで、会議中にメモを取っていたことはひとまずわきに置き、自分の担当部分のファイルを最終的に保存した日時を「担当部分の議事録が完成した日時」とみなします。議事録ファイルの作成を開始したのは会議翌日の朝9時からと仮定すると、このファイルが完成するまでの時間を議事録作成にかかった時間とみなせますので、下のような表が出来上がりました。

これで「お、やっぱり自動化ツールで効率化できてる!」と結論付けてしまうのは早すぎます。なぜなら会議の時間(=録音時間)も完成した議事録の文字数もそれぞれ異なるからです。ここを補正して正しく比較していく必要があります。
そこで、会議の時間や議事録の文字数も比較してみました。これを見ると、所要時間は180分→138分で確かに短くなっているけど、会議自体の時間も150分→110分なのだからそりゃ当然でたいして効率化されていないようにも思えます。でも議事録の分量を見ると2939文字→3759文字なので、より多くの分量を短い時間で完成させているのだからやはり効率化できているようにも思えます。これをどうやって考えていけばいいでしょう?

会議を内容の性質で分けてみる
もう一度次第を見ていただきたいのですが、次第の内容は大きく2種類に分けられると思いました。それが①挨拶部分②質疑部分です。
①の挨拶部分というのは、誰か一人の人などが一方的に喋るパートで、1.事務局長挨拶とか2.偉い人の挨拶の部分です。ここは誰がどういう発言をしたかという議事録は必要なく、挨拶する人は原稿を見ながら喋っていたりもするので飛躍した発言にもなりにくいので、作業としては挨拶の内容を要約すればよいのですが、一人が喋り続けているので文字起こしのボリュームも結構あります。一方で②の質疑部分は、前回のnoteでも書いた通りそもそも会議メンバーの中から質問や意見はあまり出てこないため、文字起こしのボリュームも少なく議事録の文字数も少なくなりますが、メンバーがその場で思ったことを発言しているので、発言の意図を考えながら文章を修正する必要が出てきます。この2種類は性質が全く異なるので、別々に比較をする必要があると考えました。

「会議ではほとんど発言がない」ということは
ここで、②の質疑部分の議事録はどちらの会議でも1000~1200文字に収まっています。実際の会議を振り返ると、事務局側が「本件について、ご意見やご質問があればお願いします」と発言を促しても結局誰からも発言はなく、議事録には「質疑:特になし」と記載するだけで終わっているという実態があります。したがって、どちらの会議でも②の質疑部分の議事録の作成にはほとんど手間がかかっておらず、会議自体の所要時間に関わらず2回ともほぼ同じくらいの時間で完成すると仮定できます。
そこで、②の部分の議事録作成にかかる時間をA:30分の場合とB:60分の場合の2通り考えてみます。Aの場合、残りの①の部分の議事録作成にはそれぞれ120分と80分、Bの場合はそれぞれ90分と50分となります。
まず、A:30分の場合を表にすると下のようになり、作業時間1分当たりの議事録文字数は11.7文字→25.3文字で生産性は2.16倍、会議時間に対する議事録作成時間は6倍から2.7倍と55%削減になりました。

次に、A:60分の場合を表にすると下のようになり、作業時間1分当たりの議事録文字数は14.6文字→35文字で生産性は2.16倍、会議時間に対する議事録作成時間は4.8倍から1.95倍と59%削減しました。

結論と感想
自動文字起こしツールtorunoを使うと、議事録作成の生産性は2倍以上向上するということが分かりました。この結果をエンジニア系上司とともに職場の総務部門のリーダーに説明に行き、全社的にこのツールを導入することの有用性を力説したことを覚えています。ご想像の通り、ここまで実証してもこの職場全体にツールが導入されることはありませんでしたし、この結果も他の部署に共有されることはありませんでした。ですので、他の部署の人たちは相変わらずイヤホンで音源を聴きながらひたすら手で文字起こし作業を続けていましたし、「一言一句違わず文字にしろ!」と半ばイジメのような指示を受けて休日も家で真夜中まで作業していたという人もいました。(当然その人は辞めてしまいましたが)
これは、2021年当時検証したものなので、22年末のChatGPTの登場以前の話です。ChatGPTが出てきてからは、文字起こしのあとの要約に使うようになりさらに生産性は上がりましたし、今ではわざわざ文字起こしと要約と2度に分けなくても勝手に議事録にまでしてくれるツールも登場しています。
それでもまだ人が一言一句間違うことなく文字に起こさないといけないのでしょうか?完ぺきではないにしても機械がほぼできるようなことをなぜ人間がする必要があるのでしょうか?それをすることで人がどのような成長をすると思っているのでしょうか?チャンスがあったら理由を訊いてみたかったです。