
Azure AI Content Understandingを活用してマルチモダリティによる顧客への価値を飛躍的に高める
AI - AI Platform Blog をベースに、Content Understanding の事例を深堀してみる。
なぜ今「Content Understanding」なのか?
Azure AI Content Understanding は、新しい Azure AI サービスとして、LLM (大規模言語モデル) と SLM (小規模言語モデル) を活用し、テキスト・オーディオ・画像・ビデオなどのマルチモーダルデータを同時に処理できるのが大きな特徴。事前構築済みテンプレートや自動化されたモデルアップグレードにより、開発のスピードと精度を高め、カスタマイズ可能な構造化出力を生成することで、さまざまなユースケースに対応する。

Azure AI Content Understanding がもたらすメリット
1. 拡張性と効率化
統合サービスでマルチモーダルデータを取り込み、データ量が増えても簡単にスケールアップ可能
ワークフローを一元管理し、処理コストを削減
2. 自由度の高いカスタマイズ
抽出結果のスキーマを定義し、業務に合わせた出力形式を作成
事前定義スキーマや独自スキーマを選択可能で、カスタム要件に柔軟に対応
3. 信頼できる結果(グラウンディング)
出力と元データを紐づけることで、幻覚(hallucination)の回避やデータ追跡を実現
人間によるレビューを組み込み、品質管理を強化
4. 信頼度スコアで品質を可視化
抽出された情報に信頼度スコアを割り当て
スコアに基づき自動化と人的レビューを切り分けることで、効率的な運用を実現
5. 高精度と安定性
高度なAIモデルにより、誤抽出を減らしビジネス価値を向上
一貫した結果を提供し、反復的な分析やレポーティングを容易に
6. コスト最適化
Azure のエコシステムと連携し、ワークフローの合理化を実現
無駄なリソースを削減し、価値実現までの時間を短縮
幅広い業界での活用シーン
1. コールセンター・カスタマーサービス
ASC や Numonix が利用し、通話録音と分析を効率化
音声・テキスト・ビデオの要約により、KPI管理や顧客満足度を向上
2. 音声テキスト変換ドキュメントの自動化
Philips の事例のように、音声記録をテキスト化し要約や編集に活用
会議録や医療現場など、情報共有が迅速かつ正確に
3. 資産管理・検索システム
ipv や WPP のように、複数フォーマットのデジタル資産を一括管理
画像・動画などからメタデータを抽出し、高度な検索機能を構築

それぞれの事例はこちら
WPP transforms multimodal data into insights | Azure AI Content Understanding
ASC integrates capture modalities into one request | Azure AI Content Understanding
Philips SpeechLive delivers accurate speech-to-results | Azure AI Content Understanding

事例:Numonixについて
Numonixは、さまざまなモダリティにわたる顧客とのやり取りをキャプチャ、分析、管理するコンプライアンス録音を専門とする企業。企業が顧客とのやり取りから価値を引き出す方法を革新し、収益成長の加速、顧客体験の向上、規制遵守の維持を支援するソリューションを提供している。最先端テクノロジーを活用し、企業がコンプライアンスを確保しリスクを軽減し、コミュニケーションデータから実用的なインサイトを発見できる強力なツールを提供している。
課題
Numonixには、規制遵守が極めて重要な多数のコールセンターの顧客が存在。顧客の通話や顧客とのやり取りを監視し、コールコンプライアンスの問題を解決し、データから貴重なインサイトを収集・抽出する手段を必要としていた
音声、画像、動画、テキストなど多様なフォーマットからインサイトを抽出し、データの品質と正確性を向上させ、ワークフローを効率化する必要もあった
手動で通話を評価するプロセスは煩雑で不正確かつ非効率的で、多大なリソースを要する
従来型のオンプレミス環境では、複雑なハードウェアが必要で柔軟な対応が難しく、突然の容量不足や予測不能な拡張の要望に素早く対応することが困難だった
解決策
こうした課題を解決するため、NumonixはMicrosoftと連携し、Azureの柔軟なクラウドサービスを活用してマルチモーダルコンテンツをより適切に管理できるようサービスをアップデート。具体的には、Azure AI Content Understandingを採用し、以下を実現している:
さまざまなデータ形式からマルチモーダルAIアプリを構築できる
個別のモダリティごとに分かれていたワークフローを統合
あらかじめ用意されたテンプレートや効率化されたワークフローを活用し、通話センター分析、マーケティングオートメーション、コンテンツ検索などのユースケース向けに出力をカスタマイズ可能
特殊なAIスキルを必要とせずに高度なセキュリティと正確性を維持
取り組みの詳細
Numonixは音声、動画、テキスト、画像など複数のモードで録音された通話データからインサイトを抽出できるようになった
通話やミーティングを文字起こし・分析し、文脈を把握し、通話のやり取りの動画を確認し、すべての会話にわたってコンプライアンスを確保可能になった
Azureへの移行によってオンプレミスのサーバー環境に伴うコストや継続的なメンテナンスの課題が解消
必要に応じて追加容量が求められる場合にも、処理するコンテンツが増加した分だけサービスがシームレスに拡張される
コメント
「Azure Blobストレージアカウントを当社プラットフォームと統合する機能を含め、シームレスな拡張性をお客様に提供できるようになった」
と語るのは、Founder兼CEOのMichael Levy
「当社のプラットフォームは強力な機能性、卓越した柔軟性、包括的なセキュリティを兼ね備え、これらは当社が誇りを持ってお客様に提供する重要な利点。Azureを導入するという決断は、クラウドネイティブなソリューションを提供し、お客様により迅速なデプロイを可能にすると同時に、長期的な拡張性、テクノロジーの進化、強固なセキュリティを保証するうえで大きな変化をもたらした。利用ユーザー数を1,000から10,000に増やす場合でも、ライセンスの調整だけで対応が可能になり、複雑なバックエンド改修やDevOpsの介入は不要になった」
成果
Azure AI Content Understandingを活用することで、Numonixは業界トップクラスの品質管理を提供
コールカバレッジを約3%から最大100%まで拡大
コストも削減されたため、これまでほど多くのリソースを消費しなくなった
「生産性を何倍にも高める効果がある」とNumonixのCTOであるEvan Kahanは語る
「複数のモダリティにわたってAzure AI Content Understandingを活用したことで、当社が顧客に代わって取得する録音データの価値を大幅に引き上げることができた」
同時に、Numonixはより多くの付加価値を顧客に提供するため、ビジネスの可能性を拡大:
従来の音声提供だけでなく、動画、画面共有、ドキュメント共有、チャット、ライブインタラクション、ドキュメントインテリジェンスまで幅広く対応
セキュアかつコンプライアンスに準拠したミーティングインサイトや個人情報(PII)のマスキング、自動リスクアラートなど複数のツールを組み合わせ、顧客がデータのフルポテンシャルを引き出し、効率化とイノベーションを推進できるよう支援
「こうした要素をすべてまとめて活用できるようになった…音声や動画などのデータから可能な限り多くの価値を引き出せるようにすることで、以前は得られなかった包括的な情報をお客様に届けられるようになった。Azure AI Content Understandingを利用することで、Microsoftの各種ツールを組み合わせ、当社の顧客に全体像をもたらすことができる」
とEvan Kahanは語る
Get started
引用
Azure AI Content Understanding ~マルチモーダルソリューションの開発の加速~ - Speaker Deck