Microsoft Build:身近に役立ちそうな部分だけフォーカスしてみた。
2024年5月21日からMicrosoflt Buildが開催されています。いろいろなセッションが行われていますが、ハードウェアの話があったり、業務全般的なインテグレーションの話があったり、技術者向けの部分があったり、しかし中には私たちの生活に非常に身近な部分もあり、今回の記事では比較的私たちの生活に近い部分を主にピックアップしてまとめてみました。
なお、Microsoft Build全体についてはこちらでかなり詳細につづられていますので、全部しっかり知りたいという方にはこちらで全体像をご確認されるとよいかと思います。
Day1のキーノートをフルでYoutubeで見ることも可能です。
Day0: Copilot+ PC
Microsoft BuildのDay1に先立つ、Day0としてCopilot+ PCが発表されました。先立つ発表ということはMicrosoft社の中でも非常に重要な部分と考えているのでしょう。数年~10年くらいかけてすべてのPCをこのようなAI PCに切り替えていく戦略なのかもしれません。
以下は英語の動画ですが、1分ちょっとの動画でCopilot +PCがどんなことができるのかがわかります。
すべてのPC操作を記憶して、戻せるRecall機能
Copilot+ PCで一番の注文されている機能が、PC操作をすべて記憶して、、時を戻せる「Recall機能」。
どのフォルダに何を置いたっけ?とかあそこで見たWEBサイトなんだったけ?などのようなもやもやなど解消する機能です。
これはすべてスナップショットとして保存されていくようですが、そのデバイスは私のものであり、Copilot AIはローカルPCの中で動きますので、その情報を外に漏らさないわけです。
そこが非常に強いところです。
その分ハードウェアの性能要求が高いですが。
リアルタイム画像生成
ざっくりした絵を描いていくとAIがその場で詳細な絵に仕上げてしまう機能。どこかのAIサービスで見たことあるものですが、これが標準で使えてしまうようです。(上の動画の0:38くらいから)
リアルタイム多言語対応
Microsoftは会議中のリアルタイム文字起こしなどもやっていましたが、これを翻訳してしまうというものです。
昨今のAIではリアルタイム翻訳機能なども出てきていますが、これがデフォルトで使えてしまうということですね。AI系の情報は英語のものが多いので、日本人にはかなり助かりますね。(上の動画の0:50くらいから)
今までのPCは、、
私のPCは今年買ったばかりですが買い替えいつになるかな。。
Copilot +PCの未来
Recallなど注目の機能はあるんですが、最も重要なのは自身のPCでローカルのAIが動かせてしまうということだと思っています。
プロンプトを書いて生成AIと対話する場合、生成AI側に前提条件などけっこういろいろ与えたうえで指示をしないとうまく動いてくれないわけで、それが大変だったりするわけですが、普段使いのPCからCopilotのAIが私のことを学んでくれることによって、そういった前提条件などを入力しなくても理想的な振る舞いをするように学習させていく可能性を秘めています。
そうなるとAIに愛着がわいてくるかもしれませんね。他人のPCを操作する感覚も全く変わってくる可能性があるかもしれません。
Day1: GPT-4oとマインクラフト
やはりGPT-4oかというところですが、やっぱりです。
こちらの動画で1:38くらいからGPT-4oと一緒にマインクラフトをプレイしています。ゾンビがでてくるところとかいいですねー。GPT-4oの感情が入った音声の良さがよく出ているデモだと思います。
なお、ChatGPT-4oについては以下の記事でまとめておりますので、ご参考にしていただければと思います。
Day1: GPT-4o on Azure AIとショッピング
こちらもマインクラフトと同じ動画ですが、ちょうど4:00くらいのものになります。
冬のキャンプに行く際の靴をAIと相談しながら決めています。AIが話している間も、こちらから話しかけてリアルタイムで会話が進んでおすすめされた商品を購入するという流れです。今後確かにこうなっていくだろうなということが予測されますね。
Microsoft Teamsの機能アップ
ビデオ会議の内容要約
Teamsのビデオ会議には録画と文字起こし機能があります。文字お越しされたデータを生成AIに流し込んで議事録を作成したりというのはできたわけですが、Copilot AIが会議内容を自ら要約して提示してくれるわけですから議事録作成の支持さえしなくてもよくなりますね。
話者ごとに会議を録画
要約の機能に追加して、会議の中で誰が発言したか、どんな話題についてだったのかをCopilot AIが精査をしながら記録を取るという機能です。
商談の場面だと主にお客様からの発言を振り返りたかったりすることがありますので、これはとても重宝しますね。
最近のでは生成AIもマルチモーダルに進み、動画の解析などを行えるようになってきましたが、Teamsで録画したデータをそれぞれ、生成AIモデルが扱えるドライブにコピーして、それを生成AIに解析させてという手間がなくなるのは何ともうれしいことですね。
会議内容についてAIと対話
会議中や終了後に、会議の内容についてAIに質問したり対話ができる機能が追加されるようです。
振り返りの際に、要約を見るだけで終えることもできますが、さらに質問したり、会話がしたりできるということです。要約だけでは足りないということも往々にしてありうることなので、この機能も非常に現実的で使えそうです。
Microsoft Edgeでリアルタイム翻訳機能
今でもYoutubeで自動翻訳された字幕などはありますが、リアルタイム翻訳で見れる機能が追加されました。字幕ではなくて音声による翻訳というのも大きなアドバンテージだと思います。
ブラウザ(Edge)で使えるので、適用範囲が広いです。Youtubeでも多言語の字幕を選択できない場合もありますし、動画サービスに関係なくどんな動画でも翻訳できてしまうのはうれしいです。
特に日本人にとってはAI関連の情報は英語が多いので、そのまま翻訳されたものを見れるのはメリットが大きいですね。
まとめ
Team CopilotもEdgeもどちらも便利そうで非常に使い勝手がよさそうですが、問題は精度になるでしょうね。ChatGPT-4やGeminiの翻訳性能は非常に高いものの、動画の内容によって翻訳の難しさが違いますし、自然な日本語にはなかなかならないかもしれません。
また、Teamsについても要約の精度だったりが期待したものと違うということもあり得るでしょう。
しかし、昨今のAIの流れを見れば、どんどんよくやっていくだろうことが予測できますので、精度が思ったほどよくなくても切り捨てずにいつか使えるようになるのを注視して引き続きトライしていきたいなと思います。
いいね!やフォローで、ぜひ応援よろしくお願いします!
励みになります!
また、X(旧Twitter)でAIについての雑談を不定期に行っておりますのでフォローをお願いいたします。