見出し画像

生成AIを活用した電話応対などの自動化:新技術「Realtime API」の実用事例


はじめに

業務効率化や自動化の手段として生成AIの活用がますます注目されています。特に、OpenAIが先日リリースしたRealtime APIは、生成AIを活用したマルチモーダルな音声操作をサポートするAPIとして、オペレーション業務の自動化に新たな可能性をもたらしています。

本記事では、Realtime APIを活用した自動化が期待されるケースを紹介し、その具体例として弊社で作成した「クレジットカード会社向け電話応対アシスタントAI」についてデモ動画を通じて解説します。

デモでの応答履歴

オペレーション業務における課題

多くの業界(特にサービス業)では、電話応対や受付対応などのオペレーション業務が日々行われています。これらの業務は社内の重要情報や顧客情報を扱うため企業にとって不可欠ですが、現状は人的リソースに大きく依存しており、AIなどを活用した効率化・自動化には至っていません。

人的リソースに依存する状況が続くことで、人件費の高騰や対応品質のばらつきといった課題が生じています。これらの課題を詳しく見ていきましょう。

人件費の高騰

オペレーション業務は多くの場面で人手を要するため、人件費が主要なコスト要因となります。特に大量の顧客対応が求められる業務では、限られた従業員では対応しきれず、追加の人員が必要になります。

時間外での対応が困難

電話応対やカスタマーサポートといった業務は、従業員の勤務時間内に限定されるため、営業時間外の対応が難しくなります。仮に24時間対応体制を整えても、前述した人件費の高騰に拍車をかけてしまいます。

対応品質の差

人的リソースに頼り続けることで、各人のスキルや経験によって対応品質にばらつきが生じます。結果として顧客満足度にマイナスな影響を与えたり、社内業務が滞る可能性があるため、一貫した品質の維持が必要不可欠です。

Realtime APIによる業務革新

先ほどの課題に対して、生成AIを活用したRealtime APIは効果的な解決策として注目されています。Realtime APIはテキストと音声の入出力に対応し、マルチモーダルな会話をリアルタイムで実現するためのAPIです。

従来の音声アシスタントAIでは、音声の書き起こしモデルやテキストから音声への変換モデルといった複数のモデルを組み合わせていたため、会話内の感情やアクセントが失われ、自然な会話をリアルタイムで行うのは難しいという問題がありました。

しかし、強力な生成AIでサポートされているRealtime APIを活用することで、リアルタイムかつ自然な会話を実現することが可能となっています。

従来と比較して、最も大きな進歩は「ユーザーとの会話の流れ」を適切に理解できるようになったことです。生成AIの発展により、ユーザーが話している途中で会話を遮られたり、質問が挟まれた場合でも、自然な形で会話を継続することが可能となりました。

Realtime APIの仕組み

Realtime APIは、OpenAIが提供するAdvanced Voice ModeのAPI版です。マルチモーダルなLLMであるGPT-4oと、ブラウザとサーバー間の双方向通信を可能とするWebSocketを活用することで、リアルタイムかつ自然な会話を実現しています。

WebSocketを介して双方向通信を可能に

具体的には、GPT-4oの活用により1つのモデルで音声認識から回答生成、読み上げといった会話の工程をスムーズに実行できるようにしています。
加えて、WebSocketの導入により従来の通信規格と比べてリアルタイムでの情報のやり取りが可能となっています。

これらの仕組みにより、AIとの対話においてより人間らしい自然な会話をすることが可能となりました。

Realtime APIの利点

Realtime APIをオペレーション業務に導入することで、正確かつ自然な対応を顧客に提供できるだけでなく、24時間稼働や一貫したアウトプット品質の提供が可能になるなど様々な利点があります。

自然かつリアルタイムな応対
これまでの音声アシスタントでは難しかった、自然な抑揚や会話の流れ・言葉のニュアンスの理解がリアルタイムで可能となります。

24時間稼働の実現
オペレーターや受付スタッフなどの人的リソースに依存することがなくなり、常に顧客の問い合わせに対応することが可能となり、顧客満足度の向上につながります。

一貫した応対品質
事前に社内情報や顧客情報を参照することで正確な応対が可能となり、対応品質のばらつきを最小限に抑えられます。

多言語対応
Realtime APIは様々な言語での対応が可能となっており、グローバルな顧客サービスを実現します。

コスト削減
上記の利点により、オペレーション業務の運営コストの大半を占める人材採用や人材育成コストの大幅削減が可能となります。

Realtime APIの導入が期待されるケース

Realtime APIはコールセンターやインフォメーションセンター、英会話教室といった場面での導入が期待されます。それぞれの現状とRealtime API導入後の変化を見てみましょう。

コールセンター

現状
人手で対応している企業がほとんどで、深夜や休日の対応には追加の人員が必要となり、人件費が高くなるケースが多いです。さらに、従業員によって対応品質にばらつきがあります。

導入後
24時間自動応答が可能となり、深夜や休日の対応もカバーできます。さらにリアルタイムで正確な顧客対応ができるため、コスト削減をしつつ顧客対応の質を高めることが可能です。

商業施設や空港のインフォメーション

現状
対応できる従業員が限られているため、混雑時や多言語対応には限界があります。対応の遅れが発生したり、対応内容の正確性にばらつきが生じてしまいます。

導入後
混雑時でも自動応答によって迅速に対応でき、かつ多言語での案内も可能です。対応遅延の発生を最小限に抑えつつ、対応内容の一貫した正確性を保つことができます。

英会話教室

現状
講師の数が限られているため、特に対面の場合は授業時間を顧客に合わせて柔軟に設定することが困難です。オンラインの場合でも予約がなかなか取れないという問題もあります。また、講師によって授業内容の質に差が出ることもあります。

導入後
個人に合わせたレベルの授業をいつでもどこでも実施することが可能です。授業内容の記録やその場でのフィードバックも行うことができ、効果的な言語学習が実施できます。

デモ:「クレジットカード会社向けの電話応対AIアシスタント」

今回のデモでは、クレジットカード会社のコールセンターを想定した本人確認からの支払日の確認、利用履歴の確認、限度額の引き上げ対応の3つを用意しました。また、デモ向けに以下の顧客を想定してやり取りしています。

名前:田中一郎
電話番号:1234-5678
支払い日:毎月27日
利用履歴:9月3日に15,000円をコンビニ、9月25日に10,000円をレストランでそれぞれ利用
滞納歴:有り

本人確認から支払日の問い合わせ

顧客が支払日を問い合わせようとすると、電話応対AIアシスタントはまず本人確認を実施します。本人確認が取れ次第、顧客からの質問に答えることができており、クレジットカード会社にとって非常に重要なセキュリティ対策を講じることが可能です。

利用履歴の確認

顧客からの利用履歴に関する問い合わせについて、日付・金額・内容を正確に伝えることができています。

利用限度額引き上げについて

顧客が利用限度額の引き上げが可能かどうか問い合わせていますが、過去に滞納歴があったため現在は難しい旨を伝えています。支払い履歴以外の情報も事前にインプットが可能なため、こういったイレギュラーな対応も可能です。

これらのデモ動画から、本人確認や顧客からの各種問い合わせに自然かつリアルタイムな会話で対応できていることがお分かりいただけたと思います。

おわりに

本記事では、生成AIを活用したRealtime APIの概要と、その導入が期待されるケースについて紹介しました。Realtime APIを活用することで、オペレーション業務を自動化し、業務効率化やコスト削減、対応品質の向上を同時に実現できます。また、今回ご紹介したクレジットカード会社向けのデモは、生成AIによる音声操作ツールが実務でどのように役立つかを具体的に示す一例です。

弊社のAI Transformation(AX)事業部では、今回紹介した音声操作ツールによる業務自動化の事例に限らず、生成AIを活用した様々な業務効率化の支援を行っています。お客様のニーズに合わせた最適なソリューションを提供し、AIによる業務変革(AX)をサポートしています。ぜひお気軽にご相談ください。