【30億円調達】音声対話AIプロダクトをエンジニアリングするということ
IVRy(アイブリー)のエンジニアの yuri ( @yuri_ivry ) です。
対話型音声 AI SaaS の IVRy は、2024年5月にシリーズ C ラウンドで30億円の資金調達を行いました。
この記事では、シリーズ C スタート時点の IVRy のエンジニアリングの様子と、今後何をつくっていくのか?についてご紹介します。
この記事はシリーズ C の資金調達に際してのリレーブログの13記事目です。
既に公開済の記事は以下のラインナップです。
代表奥西による今後の方向性の解説
マーケ・セールス・HR・ファイナンス・プロダクトマネジメント等の各部門担当者によるこれまでとこれからの紹介
投資家と代表の対談、社内メンバの対談・鼎談
どれも IVRy の未来に関して熱く語られており面白い内容ですし、このあとも AI や PR 等の部門記事や対談記事等が多数控えていますので、本記事と併せてぜひご覧ください。
自己紹介
IVRy のエンジニアの yuri です。IVRy には、最初の資金調達のシリーズ A 直後の2022年初頭から携わっています。
入社当初から今に至るまで IVRy のエンジニアリングにまつわること全般を担当しています。
最近はプロダクト開発チームの運営、エンジニア組織の中長期ロードマップの策定と実行推進、そしてエンジニア採用活動に重心を置いて業務を行っています。
この記事ではそんな私から、シリーズ C スタート時点の IVRy のエンジニアリングの現在と、シリーズ C 期にやっていくことについてご紹介していきます。
IVRyのエンジニアリングの現在
2024/6時点の IVRy のエンジニアリングの様子を、プロダクト・システム面と、チーム・組織面の2つの角度からご紹介します。
提供しているプロダクト
私たちの事業ドメインは対話です。
電話という音声インタフェースを入口として、法人コミュニケーションを自動化・効率化するソフトウェアを作っています。
上記の図に基づいて、ユーザ A が飲食店 X に電話問い合わせをするユースケースを例に、IVRy のシステムを紹介します。
エンドユーザ(ユーザ A)からクライアント(お店 X)に対する電話問い合わせの電話を Twilio 経由で IVRy が受け取ります。
ユーザ A が電話で伝える「予約したい」といった音声を基に、どんな問い合わせなのかを解釈します。ここでは LLM や機械学習モデルを組み合わせた AI 対話システムを利用します。
解釈した「予約」という問い合わせ内容に対して、お店 X ではどんな対応をするべきかをクライアントナレッジ DB から取り出します。
「SMS でネット予約ができる URL を送付する」「お店の電話を実際に鳴らしてスタッフが対応する」「連携している予約台帳の API を呼び出し予約を行う」など、お店 X のユースケースに沿った自動応答をします。
通話履歴は IVRy の設定画面から閲覧ができます。録音された通話音声を聞いたり、文字起こしや要約を表示することもできます。
シリーズ B 開始時点の IVRy は、プッシュボタンでの入力とあらかじめ決められたルールに基づいて自動応答をするサービスでした。
「〜の御用の方は1番を、〜の御用の方は2番を押してください」という合成音声の案内に従って、プッシュボタンを押して進めるような、アレです。
プッシュボタン操作と自動応答ができる電話を作れるだけでも大きな価値でしたが、この1年で上記のような LLM/AI の力で音声通話を自動化・効率化するソフトウェアにまで進化してきました。
もともとのプッシュの IVRy に AI 音声通話が加わることで、より多くのクライアントの課題解決のお手伝いができるようになりました。
その結果として、アカウント数は累積12,000アカウントを超え、発着電件数は2,000万件を突破、80以上の業界/業種で活用されるまでに成長しています。
私たち IVRy が向き合っている対話というドメインは、LLM の進化を直接的に享受しやすい構造になっています。
対話のデータが宝の山であることは誰もがわかりながらも、以前は AI で扱う難易度が低くありませんでした。
しかし、LLM の登場によって対話データは格段に扱いやすくなり、データの持っている価値を活かしやすい環境になりました。
また、今後の LLM の進化によってレスポンス速度や安定性が向上すればそのまま電話体験の UX 向上に繋がりますし、LLM の精度向上やユースケース拡張によって IVRy ができる自動応答の可能性はもっと広がります。
IVRy が相対している対話というドメインは、LLM の登場によってゲームチェンジが起きていて、かつ今後も LLM の進化によってより大きな価値を作れそうということです。
既存のシステムに後付けで AI 機能をバンドルするのとは根本的に異なり、AI がプロダクトの根幹である対話と強く結びついており、AI が直接的にプロダクトの価値・優位性を作っているというのが IVRy の大きな特徴といえます。
プロダクト開発チーム
私たちは総勢30名強のチームでプロダクト開発をしています。
2024年6月末時点での正社員メンバは下記の人数です。
プロダクトマネージャー(PdM): 6名
デザイナ: 0名(!)
エンジニア: 17名
AI エンジニア: 2名
インフラエンジニア: 4名
フロントエンド・アプリエンジニア: 5名
サーバサイドエンジニア: 5名
QA エンジニア: 1名
実際にはこの中に EM がいたり、FE/BE を両方やるエンジニアがいたり、BE/SRE を行き来するエンジニアがいたりはしますが、単純化して書いています。
この他にも業務委託という形で IVRy のプロダクト開発に携わってくれているメンバが各職種合わせて10名程度いて、総勢で30名強のチームになっています。
エンジニアメンバの主な出身企業は上記の画像の通りです。
みんなが一度は使ったことがある大きな Web サービスの開発をリードしてきたメンバが多いです。
エンジニアの日々の働き方としては、「機能開発による数値改善プロジェクト」や「新規プロダクトの立ち上げプロジェクト」など、四半期ごとに様々なプロジェクトに属しながら開発をしています。
このあたりのエンジニアの働き方については過去の記事でも詳しくご紹介していますので、ご覧いただければと思います。
※ 余談ですが、上記の記事について2023年夏当時は週1回のリリースだったんだなあと懐かしく読み返しました。2024年6月のいまは毎日何度でもリリースするようになっています。
シリーズC期にやっていくこと
ここからは、今回調達した大きな資金を活用して、IVRy がどのようなプロダクト開発を行っていくかについて紹介します。
IVRy が見据えるのは国内で市場規模15兆円とも言われる法人 AI 対話の市場、そしてグローバル市場です。
電話の効率化だけ見てもまだまだ市場の0.1%も取れていない段階ですが、IVRy はあくまでその先の非常に大きな TAM を見据えています。
対話にまつわる様々なプロダクトを作り、市場に投入し拡げていくことによって、ソフトウェアと AI の力で Work is Fun な世界を作っていきます。
前述の通り、IVRy では現在も LLM を中心に AI を真ん中に据えたプロダクト開発を行っています。
AI をプロダクト開発シーンで利活用する(GitHub Copilot など)だけでもなく、既存の機能・データに AI でちょっとした便利要素をプラスアルファするでもなく、AI が解決する価値がそのままプロダクト価値になっています。
そして大切なのが、これが既に事業として成立しているということです。
シリーズ C 期においても、AI を活用したプロダクト開発を更に加速させていきます。
その how の根幹となるコンパウンド AI システムの開発については、別の記事でも紹介しているので併せてご覧ください。
ちなみに、AI を活用したプロダクト開発、と聞くと、IVRy には AI エンジニアの面白い仕事はたくさんありそうだけど、ソフトウェアエンジニアはどうなんだろう?と思われるかもしれません。
ソフトウェアエンジニアとしても面白い仕事が、IVRy には本当にたくさんありますので、このまま続きを読んでいただけると嬉しいです。
シリーズ C 期に IVRy がどんな開発を行っていこうと考えているか、以下で4つほど紹介します。
① 電話サービス品質の維持・向上
② 電話プロダクトとしての進化
③ 多言語対応・海外展開
④ マルチプロダクト展開
① 電話サービス品質の維持・向上
そもそも電話は、24時間365日普通に繋がって当たり前というサービスレベルの期待値です。
当たり前に求められる品質が一般的な Web サービスと比較してとても高いので、どうやって電話が繋がっていることを技術的に担保し続けるか、どうやって高速な機能追加の中でもその品質を担保し続けるかというのは、とてもチャレンジングな技術課題です。
また、音声対話を扱っている以上、少しの遅延で体験が大きく変わりますし、僅かなエラーが毀損する UX も小さくありません。
AI 部分も含めたソフトウェアサービスとしてのサービスレベル向上は、IVRy というプロダクトの品質に直結しています。
今と未来のクライアントに IVRy を品質面で安心して使い続けてもらうことは、エンジニアとしていまもこれからも向き合い続ける、大きなテーマです。
② 電話プロダクトとしての進化
電話の自動応答のプロダクト改善についてもやりたいことがまだまだあります。
IVRy はこれまで自動応答するところにフォーカスして開発をしてきたので、人と人が直接やりとりする電話としてみるとまだまだ伸びしろが大きいです。
意外に思われるかもしれませんが、例えば保留や内線転送といった一般的な電話で使える機能は未だ IVRy にはありません。
こうした一般的な電話機能を、AI や自動応答を絡めた形で実装していくことができれば、新しい電話体験を作れるはずです。
そうした、電話をもう一段階進化させられるような機能開発にも積極的に取り組んでいきたいと思っています。
③ 多言語対応・海外展開
多言語対応や海外展開についてもより本格的に進めていきます。
LLM を活用していることでスキップできる論点も多々ありますが、それでも多言語対応や海外展開は一筋縄ではいきません。
一方で、既に IVRy に実装済みのいくつかの言語に対応した機能によって、店舗問い合わせのインバウンド対応が IVRy で可能であることが実証でき始めています。
インバウンド需要はますます増えていくし、その最中で起きる課題を IVRy が解決できることもわかってきている。となれば、やらない理由はありません。
海外展開も含め、各国のニーズやユースケースでも活用できる AI プロダクトに進化していくべく、もっと機能開発を進めていきたいと思っています。
④ マルチプロダクト展開
広大な法人 AI 対話マーケットに展開していくためには、音声対話の IVRy 以外のプロダクトを大きくしていくことも必要だと考えています。
IVRy を利用してくれているクライアントが、自身の過去の電話データを活用し、店舗や事業所に適した AI を作れれば、もっと広い問題を自動で解決できるようになるかもしれません。
また、予約や注文システムとの連携を増やすことで、もっと様々な業務ユースケースを自動化できるかもしれません。
IVRy が持っている AI プロダクト開発のノウハウと、これまでに築いてきた大きなトラクションから生まれたたくさんのデータ。
これらをベースに、新しいプロダクトをいくつも作っていこうと思っています。
上記のように、LLM をはじめとした AI を活用したプロダクト開発を今後も力強く進めていくためには、
NLP をはじめとする AI の素養を備えていて、なおかつ自ら手を動かして市場にプロダクトを投入していける AI エンジニア
AI をプロダクトの中心に組み込んだプロダクトの開発を行えるソフトウェアエンジニア
が必要不可欠です。
既に PMF したプロダクトがあり、熱量が高く協力的なクライアントもありがたいことに多くいてくださる環境で、音声対話 AI プロダクトの開発、そしてマルチプロダクトの開発にチャレンジしたい方を IVRy では積極的に求めています。
まとめ
IVRy では LLM を含む AI を活用したプロダクトを開発し、既に多くのクライアントの業務シーンの中で実際に使われていることをご紹介してきました。
IVRy が相対している対話というドメインと LLM の相性の良さをベースに、これからも IVRy というプロダクトを品質面・機能面・多言語/海外展開といった方向性に進化させていきます。
また、法人 AI 対話という広大な TAM に向けて、AI プロダクト開発のノウハウを存分に活かしマルチプロダクト開発も進めていきます。
シリーズ C の IVRy のプロダクト開発にも、ぜひご注目いただけると嬉しいです。
最後に。
手前味噌ですが、日本でもこのレベルで AI プロダクトの開発ができている会社はほとんどないと思っています。
LLM を中心とした AI プロダクト開発を行い、毎日のようにリリースしているような環境は限られていると思っていて、既に国内トップクラスの AI プロダクト開発チームだと自負しています。
しかし、私たちが見据える TAM は大きく、音声対話 AI プロダクトの開発・マルチプロダクト開発を加速させていくためのエンジニアは未だ足りていません。
向こう5年できっと、ソフトウェアエンジニアの業務の中には AI を活用するような開発が当たり前に入ってくると思います。
その開発プロセスの国内先進事例は、IVRy で作られます。偉大なプロダクト開発をすることに挑戦したい方には、うってつけの環境だと思います。
未来の当たり前の AI プロダクトと、それを作る開発プロセスを、一緒にもがきながら、楽しみながら作っていく仲間を、IVRy ではお待ちしています。