見出し画像

【MODE CHANGE 2024】パネルディスカッション「AIとIoTの未来」

「AIとIoTの未来」では、現場DXの現状や各社のビジョン・技術についてディスカッションが行われました。セーフィー株式会社 代表取締役社長CEO 佐渡島隆平氏、株式会社BONX 代表取締役CEO 宮坂貴大氏が登壇し、MODE, Inc. CEO 上田学がファシリテーターを務めました。

上田:本日は、現場DXの最前線を走る2社のCEOにお越しいただきました。会社とビジョンについてプレゼンテーションしていただきたいので、まずはセーフィーの佐渡島さん、お願いいたします。

セーフィーのビジョンと現場DX

セーフィー株式会社 代表取締役社長CEO 佐渡島 隆平氏

佐渡島:皆さん、こんにちは。セーフィーは「映像が未来をつくる」というビジョンのもと、映像プラットフォームを提供しています。まさに今日、MODEさんと出会うために日々努力してきたと実感しております。私たちは、家から街までのすべてを映像データ化し、AIで理解し、自動的に意思決定ができる社会を実現することを目指し、クラウドカメラを開発し、特に建設業界での現場DXに注力しています。

建設業界で活用が進むSafieのソリューション

具体的には、デジタルツイン技術を活用し、一人の施工管理者が複数の現場を同時に監視できるようなソリューションを提供しています。数千台のカメラを導入し、業務効率の向上や現場の監視を行っているお客様もいます。弊社全体では約26万台、そのうち建設現場向けに約5万台のカメラを提供しています。

また、施工管理アプリの会社さんなどとも協力してカメラ、ドローン、AI、マルチモーダル技術で常駐業務や検査、点検などの業務効率化を進めるための法改正への提言も行っています。結果として、9600項目もの法律が改正され、アナログ規制の緩和が進み、カメラを活用した「遠隔臨場」という手法も広まりつつあります。

遠隔臨場の様子

しかし、遠隔臨場によって現場の可視化が進んでも、すべてを把握はできません。そこで現場で必要な情報を取得し、生成AIでわかりやすくまとめることや、BONXさんの音声指示デバイスを活用し、現場に具体的な指示を出す取り組みが始まっています。BizStack Assistantの活用により、単なる可視化に留まらず、適切な指示とフィードバックのサイクルが実現できることは、弊社ビジョンの実現にもつながってきます。

3社ソリューションの連携イメージ

上田:今のビジョンに至った背景を教えていただけますか?

佐渡島:私はもともと、ソニーの木原研究所から生まれた「モーションポートレート」に所属していました。2012年までは、機械学習はプログラミングで対応する必要がありましたが、ディープラーニングの登場により状況が一変しました。当時のソニーは卓越した技術力に自負がありましたが、カメラやリアルタイム情報など、データを集めることの重要性を感じ「これは来た!」と直感しました

また、家から街までをデータ化したらどんな社会が実現できるかという興味が原動力となり、起業に至りました。その中で、建設現場の方々から「困っている」という声を聞き、現場に足を運びました。そこでウェアラブルカメラの必要性を感じ、作ろうと決意したのです。現場の課題を解決する中で、現在のセーフィーの形ができあがっていきました

上田:ありがとうございます。それでは、宮坂さんお願いします。

株式会社BONX 代表取締役CEO 宮坂貴大氏

BONX創業の起点とビジョン

宮坂:BONXは創業して約10年になる会社です。創業の経緯は、大好きなスノーボードをしながら仲間と一緒に話せたらもっと楽しいのではないかと思ったことに遡ります。そこで、厳しい環境でも会話ができるコミュニケーションプロダクトを作ろうと考えました

今では、建設業界をはじめ、インフラ業界や介護施設、高級ブティックなど、さまざまな場面で活用いただいています。NTT研究所の音声技術をバックボーンに持つNTTソノリティという会社とも協業しています。私がつけているこのヘッドホンは、開放型ですが音が漏れないという不思議な製品です。「nwm ONE」という製品名で絶賛販売中です。

さて、現場での業務コミュニケーションはまだまだ遅れており、いまだにトランシーバーが多く使われていますが、遠方の人とは話せない、片方向通信である、音質が悪いなどの問題があります。チャットもかなり普及しましたが、現場でチャットをすると一旦業務が止まってしまいます。そのため、私たちは音声で常時接続された世界を作ることで、これらの課題を解決したいと考えています。

BONXが提供するソリューション全体像

私たちのソリューションを活用すれば、各地で働く現場でも、まるで隣にいるかのように同期的なコミュニケーションが可能です。さらに、今話せない人にはテキストを残したり、聞き逃した会話を後から文字起こしで確認できます。従来は、隣にいない人にわざわざ行って話すのは面倒で、伝えるのを諦めがちでした。しかし、BONXを使えば、ちょっとしたことでもすぐに伝えられ、チャットを打つ手間も省けます。

これにより、生産性が向上し、移動距離の減少で安全性も高まります。細かい確認が可能になるため教育効果が期待でき、新人もいつでも質問できて安心です。その結果、従業員の満足度が向上するだけではなく、店舗ではお客様を待たせることがなくなり、顧客満足度も高まります。BONXは単なるコミュニケーションツールではなく、音声インターフェースとして現場のDXを支援していきたいと考えてます

建設業界では、ゼネコン企業様が大規模現場でBONXを活用し、ハンズフリーでスムーズなコミュニケーションと効率的な情報共有を実現しています。

BONX利用事例

当社は音声プラットフォームだけでなく、現場で本当に使える製品を提供するためにハードウェアも自社製造しています。音声が明瞭に伝わることは非常に重要なので、ハードウェアの開発と品質の確保に注力しています

生産性の向上という面では、現場で万歩計を使いビフォーアフターを比較したところ、移動距離が20%削減された事例があります。時間の節約だけではなく労力(疲労)の軽減もできました。

困難な「ハードウェア」に挑戦した理由

上田:起業にあたって、ゲームやマーケティングなどのデジタルビジネスはハードウェアを扱わない分、楽だと思います。「ハードウェアは難しい(Hardware is Hard)」と言われる中、あえて困難なハードウェアや現場ビジネスに挑戦したのはなぜでしょうか?

佐渡島:私たちはカメラメーカー出身の3人で創業しましたが、実はハードウェア開発が嫌いでした。ハードウェアは一度ソフトウェアが不具合を起こすと文鎮と化し、改善を繰り返しても最終的にはコモディティ化してしまいます。

そのため、ハードウェアを最大限活用できるプラットフォームの開発に注力しました。多くのハードウェアメーカーがソフトウェアを軽視していますが、実際にはソフトウェアやインターフェースこそが最も重要で、使いやすさを決定します。

私たちはLinuxベースのソフトウェアモジュールを提供し、ハードウェアを作らなくても顧客満足度を高める戦略を採用しています。このファブレス戦略を通じて、ハードウェアの価値を最大化しています。

世界で勝つためには、産業が集積している場所で、より高度なサービスを作り上げることが重要です。例えば、アメリカのカメラメーカーを5社挙げるのは難しいですが、日本ではすぐにニコンやキヤノンが思い浮かびます。これは産業の集積による成果です。

その集積地で強力なサービスを提供できれば、日本は世界でも存在感を示せると考えています。特に画像処理分野では、日本にはまだ大きな可能性があります。この分野を極めることで、さらに世界での成長が期待できるのではないかという仮説を持っています。そのため、日本はハードとソフトの融合点を先駆けて作る場として非常に適していると感じています

製造業には「ハードウェアを作っていれば良い」と考える人が多いです。しかしその考え方では、最終的に安く作ることが善となり、ソフトとハードの主従関係が既に逆転している現状には対応できません。お客様がどのように使うか、つまりジョブを理解できないメーカーは厳しい立場に立たされるでしょう

MODEさんのように、お客様のジョブや発話からデータを取得できることは大きなチャンスです。「モノからジョブへ」という転換を図ることが、日本の産業にとって非常に重要だと思います。MODEさんがこの分野で広く活躍されるのは素晴らしいことだと感じます。

上田:同じ質問を宮坂さんにもお伺いします。ここまで事業を続けてこられたのは、どのような思いがあったのでしょうか?

宮坂:正直なところこんなに大変だとは思いませんでした。「産業集積」という言葉がありましたが、私も日本にはソニーやオーディオテクニカといった音響機器のブランドがあるので、最初は地の利があると思っていました。しかし実際は日本には音響系の製造工場がほとんどなく、ものづくりは主に中国に移っており、日本でイヤホンを製造できる工場がほぼないことを知ったのです。

知らなかったからこそ挑戦できた部分もあります。ソフトウェアとハードウェアの両方を作るのは大変で、それを作らなければ、私たちが実現したい体験が提供できないため、最終的には自分たちでやるしかないと決断しました。特に、スノーボードのような過酷な環境で、耳を塞がずスタイリッシュで、防水性があり、風切り音も防ぐ製品を作りたかったのですが、自身で満足できるスペックのものは市場に存在しません。だからこそ、自分たちで作り続けているのです。

上田さんも、最初は大変だということをご存じなかったんですか?

上田:そうなんですよ。それまでウェブでシステムを繰返し作り、ユーザーを増やすことに注力していましたが、面白くないなと感じはじめていました。そこで、現実世界に足を踏み出したのですが、実際にやってみると、どこにも答えが載っていないんです。設置場所が非常に遠く、ただスイッチを押したいだけなのに6時間もかかるなど、本当に大変でした。

この3社が現場DXというテーマにたどり着くまでには様々な試行錯誤がありましたが、それぞれ異なるアプローチで取り組んでいます。MODEは「センサー」で現場を可視化し、セーフィーはカメラを使って「目」として現場を改善。BONXは「音声」を使ったコミュニケーションを提供しています。

おそらく、皆さん自分たちのアプローチが最も重要だと、内心は思われているのではないでしょうか?それぞれのソリューション現場DXにおいて最も優れているというエピソードをお聞かせください。

カメラ、音声それぞれが担う役割

佐渡島:人間の脳は、視覚情報を特に理解しやすいと感じています。文字で読むより、映像で見る方が早く理解できます。新聞、ラジオ、テレビ、YouTubeといったメディアの中でも、最終的に映像が脳に入りやすいことからも視覚情報の重要性がわかります。だからこそ、複雑な説明をしなくても「見たままでわかるでしょ」という直感的な理解を大切にしています。
ただし、視覚的に情報を広げることは効果的でも、その後に実際の行動や指示を行うためには、異なる情報手段を連携させる必要があります。つまり、何が一番というわけではなく、すべてを連携して最適な判断をすることが大切だと考えています。

宮坂:私の場合も、主役はあくまでスノーボード、つまり目の前に広がる世界です。音声はその体験をより楽しく、安全にするためのサポート役として位置づけていました。その考えは今も変わりません。
現場業務のコミュニケーションでも、主役は皆さんが行う業務です。その業務を邪魔せず、自然にサポートできるのが音声だと考えています。いかにスムーズで摩擦のないコミュニケーションを提供するかが、私たちの挑戦です。

また、話す相手が人間だけではなくなっている点が大きな変化だと感じます。以前から、トークルーム内で人間同士が話す中に、ボットが参加しても違和感のない未来を想像していました。今まさにそのような時代が来ており、音声インターフェースの価値が一層高まっていると感じています。

生成AIの登場とビジネス

上田:では、生成AIの話題に移りましょう。2022年11月に生成AIが登場し、ビジネスの状況が一変しました。生成AIを見たときの最初の印象や、感じられたことを教えていただけますか。

佐渡島:私自身、ディープラーニングが登場したから何かを始めたわけではなく、映像データを長年集め続けてきました。その中で、大規模言語モデル(LLM)は、文字や音声、データ、動画をリアルタイムで扱う優れたインターフェースだと感じています。以前からチャットでの情報理解技術はありましたが、人間らしさが加わることでそのインパクトが非常に大きくなったと感じています

私たちも現場DXで“目の代わり”として活動してきました。例えば飲食店で「今日の一日を教えて」と尋ねられても、何時に店がオープンし、最初のお客様が何時に来て、どれくらい並んでいて、何が欠品しているかといった全店舗の状況を人間が把握するのは難しいですよね。しかし、ChatGPTのような技術ならそれが可能になると感じています。ただし、データがなければ活用できないという課題もあります。そこで、MODEさんのようにデータを取り込み、マルチモーダルなインターフェースを構築する取り組みが非常に重要だと思っています

例えば、現場で「どうなっている?」と尋ねると、そのデータが音声で提供され、施工の管理情報が表示される。また「設計士と話したい」と言えば、その場にいるかのように空間がつながり、直接会話ができるサービスも作っています。そして「ありがとう、その情報を議事録にして現場に共有するね」といったことも可能になるでしょう。

これこそが人間が求めているAIでありITだと考えています。人間が技術革新によって身体拡張を得ることを考えたときに、自分ならこうするというアイデアはいくつかあります。

上田:非常に具体的な未来の現場のイメージが浮かびますね。宮坂さんはどうでしょう?

宮坂:先ほど申し上げた通り、もともと人間同士のコミュニケーションにボットも参加する世界を作りたかったのですが、精度や応答性が実用レベルに達しておらず、実現できませんでした。それがいよいよ技術的に可能になったのだなと感じています

ただ、そこに賢いボットがいても、情報を持っていなければ何も教えてくれません。MODEさんのような企業が、ボットに情報を提供する役割を果たしていただけるのであれば、本当に現場で使われるものになるだろうと思います。

上田:生成AIが登場する前から、お二人の会社のことは存じ上げていましたが、生成AIの登場により「これはお二方に直接お話ししなければ」と感じたのを覚えています。というのも、現場の情報が急速に統合され、以前は個別に対応していた問題を一括して解決できる未来が見えてきたからです。
実際に一緒に取り組み始めた中で、化学反応が起きそうな予感などを、お二人から教えていただきたいと思います。

宮坂:現場がこれからどうなっていくのかを数年前にしたとき、例えば音声で「あそこの図面を出してくれ」や「今の状況を見せてくれ」と話しかければ、それがすぐに表示されるような世界にしたいと考えていました。そのために各社が連携していかなければならないという話があり、まさに今がその連携のタイミングだと強く思っています

私たちは音声インターフェースの部分をいかに使いやすくするか、どのように作り込むかを突き詰めていきたいと考えています。その先はMODEさんやセーフィーさんと一緒に取り組むことで、トータルな体験として新しいものを作り上げられるのではないかと思っています。

佐渡島:私たちツール事業者が努力を重ねることで技術が普及し、情報が集約される新しい世界が登場する中で、働く人々の変化が最も求められているのではないでしょうか?遠隔臨場、遠隔接客、遠隔警備など、遠隔での業務が新たな標準となっていくでしょう。例えば、すべての施工管理現場を経験した豊富なノウハウを持つOBの方々は、現地に行かなくても業務が可能となり、少子高齢化が進む中でも施工管理の機会を増やし、生産性の向上に貢献できます。

私たちは、AIの可能性よりも人間の能力をどれだけアシストできるかを重視しており、その結果、皆様にも新たなビジネスチャンスが生まれると考えています。遠隔での働き方が進む中で、共に新たなチャンスを創出し、協力して未来を築いていきたいと考えています

上田:現場DXの最前線で多くの事例を持つお二方から、リアルなお考えをお聞きすることができ、非常に楽しませていただきました

お二人に拍手をお願いいたします。どうもありがとうございました。