アップルのクレイグ・フェデリギ氏が語るアップル・インテリジェンスの遅延、Siriの未来、その他について | WSJ
4,898 文字
アップルはAIに全面的に取り組もうとしています。アップル・インテリジェンスと大規模言語モデルのパワーにより、Siriはこれまで以上にあなたのことを理解できるようになります。なぜ遅れているのかって?これは大きな仕事なんです。私たちはきちんとやりたいと考えています。この技術が展開されるのは何年も、正直に言えば何十年もかかる道のりです。そのため、私たちは責任を持って進めていきます。
はい、アップルのソフトウェア責任者であるクレイグ・フェデリギ氏は、私たちのiPhoneを生成AIの未来へと慎重に導いています。10月後半にiOS 18.1がリリースされる時、iPhone 15 ProとiPhone 16モデルでのみ動作する、約束された多くのアップル・インテリジェンスツールの最初のものがリリースされます。MacやiPadにも対応予定ですが、他社がAIを市場に急いで投入する中、アップルは遅れているか、少なくともプライバシーに焦点を当て、全てを責任を持って時間をかけています。
私はフェデリギ氏と面談し、アップルのAI戦略についてより詳しく話を聞きました。
アップルは生成AIに後れを取っています。ChatGPTが登場してからもう2年近くになりますが、アップルは新しい技術製品カテゴリーで最初になることはあまりありませんでした。アップル・インテリジェンスの新しい点は何でしょうか?
私たちはこれを、既存の体験の横に別のチャットボットを作って取り付けるというのではなく、深く統合されたものをどう作るかという観点で見ています。最も重要なのは、これを個人的なものと見ていることです。これまでのチャットボットの大部分は、あなたのことを全く知らない製品に焦点を当てていました。それらは強力で面白く、素晴らしい用途もありますが、私たちの製品をお客様がどう使うかに関して、インテリジェンスの本当のパワーは、あなたを理解することにあると思います。
そしてそれには大きな責任が伴います。なぜなら、そのインテリジェンスがあなたのデバイスに保存された情報を扱う必要があるからです。そのため、プライバシーは非常に重要な考慮事項となります。
ChatGPTや他の大規模言語モデルは、全てのプロンプトを強力なクラウドサーバーに送信します。しかし、アップルはAIモデルを直接デバイス上で実行することでプライバシーを優先しています。より多くの処理能力が必要な場合にのみ、暗号化されたクラウドベースのモデルを利用します。アップルはこれをプライベート・クラウド・コンピュートと呼んでいます。
ローカルで実行すべきことと、プライベート・クラウド・コンピュートに送るべきことをどのように判断しているのか説明してください。
長文の要約などの場合、デバイス上のモデルでも可能ですが、おそらく最高の結果は得られないでしょう。クラウドで実行すれば、その場合はより速く、また質の高い結果を提供できます。重要なのは、要約を依頼したメッセージが、クラウド内の信頼されたデバイスに暗号化されて送られ、そこで人工知能による処理が行われて結果が返されますが、そのデータについては何も記録されないということです。
そのメールにアップルはアクセスできず、他の誰もアクセスできません。消えてしまうんです。なぜ全てのクラウドコンピューティングがこのように機能しないのでしょうか?
まず、構築するのが難しいんです。また、多くの企業のデータに対する考え方全体とも相反します。多くの企業にとって、彼らの回答は「全てのデータを私たちに送って、私たちが読んで処理できる方法で全てのデータを保存してください」というものです。そうすれば、クラウドに質問があった時に、すでにデータを持っているので、それに対して行った処理を使って質問に答えることができます。
しかし、ユーザーとしては、それが彼らの行う全てなのかはっきりとはわかりません。今は何もしていないかもしれませんが、彼らは私のデータを持っています。将来どうするのかはわかりません。
しかし、AIとアップルに関しては、長年一つの約束がありました。Siriは13年前に導入されました。信じがたいことですが、Siriはお願いするだけで物事を実行してくれるインテリジェントアシスタントです。Siriはついにその約束を果たすのでしょうか?
その旅に終わりはありません。今日、Siriは1日に約15億件のリクエストを処理していると思います。Siriは私のために多くのことをしてくれます。ガレージを開けたり閉めたり、ライトをつけたり、メッセージを送ったり、タイマーをセットしたり、他にも何百万人ものお客様が毎日行っているようなことがたくさんあります。
そういう意味で、Siriは多くのことをしてくれます。しかし、人間として、声を使ってコミュニケーションを取り、何かを頼むということに対する私たちの期待は、ほぼ無限です。良いニュースは、Siriは今日も役立っており、何年もの間、多くの人々にとって様々な面で役立ってきました。
そして、アップル・インテリジェンスと大規模言語モデルのパワーにより、Siriはこれまで以上にあなたのことを理解し、デバイス上でこれまで以上に多くのツールにアクセスできるようになるため、さらに役立つようになっています。しかし、Siriが私の意識を持った友達になったと言えるような瞬間は来るのでしょうか?いいえ、それは続けて良くなっていくのです。
アップルは、Siriがカレンダーやメッセージなどに基づいて、より深い質問に答えられるようになると約束しています。「Siri、数か月前にカフェ・グレネルで会った人の名前は?」「ザック・ウィンゲイトさんとカフェ・グレネルで会いました」また、特定の質問に答えるためにChatGPTも組み込まれますが、それらはまだリリースされていません。
このよりスマートなSiriはいつ来るのでしょうか?
アップル・インテリジェンスで、個人的なコンテキストを理解し、アクションを起こす能力を持つ基盤を作りました。Siriはそれを段階的に採用し、今後1年にわたって段階的に恩恵を受けることになります。
最近、OpenAIは高度な音声モードをリリースしました。「クレイグ・フェデリギの髪型はどうなっているの?」「クレイグ・フェデリギの髪は、自然なボリュームのある後ろに流したシルバーの髪です」そして、「Siri、ウェブで見つけました」という具合です。
そのような大規模言語モデルの統合はSiriの将来にあるのでしょうか?
今日は何も発表しませんが、それらは素晴らしいと思います。この分野がいかに急速に進歩しているか、そしてこの種のテクノロジーの可能性について私たち全員が何にそれほど興奮しているのかを示しているだけです。
OpenAIの高度な音声モードとSiriの特性は全く異なります。OpenAIのモードは、量子力学について質問し、それについて詩を書いてもらい、さらに別の質問に答えてもらうのに適していますが、ガレージを開けたり、テキストメッセージを送ったりはできません。Siriが毎日行っている多くの便利なことを、素早くデバイス上でローカルに実行します。
ここには幅があり、機能間のトレードオフがあります。これらの世界は収束するのでしょうか?もちろん、そちらの方向に向かっています。
現在のアップル・インテリジェンスのツールの一つに、通知のサマリーがあります。私は毎日ガレージドアの開閉について多くの通知を受け取り、それをまとめて、最後にドアが閉まったことを教えてくれます。
はい、とても役立ちます。この全ての技術で、今やガレージドアの問題を解決できるようになりました。私たちはそれを実現しました。
しかし、破局や喧嘩などの個人的なメッセージをAIが要約する場合、不快に感じたり、面白がったりする人もいます。
その通りです。様々な種類のコミュニケーションがあり、時にはデリケートな問題もあります。今日、私たちがそれについて学習していない、扱わないと言うようなケースがいくつかあります。通知を自動的に要約しないケースもあります。なぜなら、おそらくうまく処理できないだろうと考えているからです。
一方で、最近、誰かが別れを告げられ、それについてとても事務的な説明をしたという話がありました。要約としては酷い仕事をしたとは思いませんが、誰もテキストで別れを告げられたくはないので、いずれにせよ良い瞬間にはならなかったでしょう。
現在利用可能なAIツールの別の一つに、クリーンアップ機能があります。一緒に写真を撮ってみましょう。クリーンアップを選択し、写真の中で気に入らない項目をタップして削除すると、AIが残りの部分を埋めてくれます。マイクを編集で消したり、あのペットボトルを消したりできます。
一部の企業は、写真の新しい部分を生成できるというかなり極端な方向を選んでいます。私たちの前にライオンを座らせたり、爆発を起こしたり、そして5時のニュースに登場したり。あなたは異なるアプローチを取っていますね。なぜですか?
そうですね、あのペットボトルを削除する機能でさえ、社内で多くの議論がありました。あのペットボトルやマイクを簡単に削除できるようにしたいのかどうか。なぜなら、写真を撮った時にそのペットボトルはそこにあったからです。
写真の意味を根本的に変えることなく、余計な詳細に見えるものを整理したいという需要は非常に高く、そのため、私たちはその小さな一歩を踏み出す意思がありました。しかし、写真には長い歴史があり、人々が写真のコンテンツを現実を示すものとして信頼できるものと見なす方法について、私たちは懸念しています。
私たちの製品、私たちの電話は多く使われており、正確な情報を伝えることは私たちにとって重要です。ファンタジーではありません。写真の小さな詳細を削除した場合でも、写真のメタデータを更新して、誰かがこれが加工された写真であることを確認できるようにしています。
現在、アップル・インテリジェンスは6月に示したものと比べて制限されています。多くの機能がまだありません。なぜ遅れているのでしょうか?
今年の始めの時点で、アップル・インテリジェンスに対する私たちのビジョンの広さと、それを全て実現するための道のりが、9月に一気に登場するような瞬間ではないことを私たちは知っていました。それは、WWDCで紹介した時から伝えていました。
これは大きな仕事であり、私たちはきちんとやりたいと考えています。何かを出して混乱させることもできますが、アップルの観点は、各部分を正しく作り、準備ができた時にリリースしようというものです。
私たちの機能について考える時、特にアップル・インテリジェンスについては、これは一度きりの状況ではありません。これは何年も、正直に言えば何十年もかかる技術の展開の道のりです。そのため、私たちは責任を持って進めていきます。
一方で、あなたはこれをマーケティングもしています。iPhoneを発売し、マーケティングを行いました。
はい、それは理にかなっています。将来に期待を持つお客様に、このスマートフォンを買えば、それらの機能を実現できるのかを知ってもらいたいのです。そしてそれは可能です。そのため、これが今日全てが揃うわけではなく、今後数ヶ月にわたって提供されることを、皆さんに理解してもらいながら伝えていこうと考えています。
でも、近々来るものは何でしょうか?
AirPodsの最適なクリーニング方法について、私たちはすぐにガイドを出す予定です。それは私の現在のテクニックよりもずっと良いものになるでしょう。今の方法は非衛生的すぎて言えませんが。
それはスクープですか?クリーニング方法についてのスクープ?
ご視聴ありがとうございます。WSJ.comでアップルのクレイグ・フェデリギ氏との完全インタビューをご覧になりたい方は、こちらをクリックしてください。
この記事が気に入ったらサポートをしてみませんか?