見出し画像

日刊AIニュース 10/5 Google AssistantとBardの統合:次世代のスマートフォンインタラクションへの一歩


Google AssistantとBardの統合:次世代のスマートフォンインタラクションへの一歩

(OJ): ねぇ、Nekoちゃん、Google Assistant with Bardって聞いたことある?

(Neko): ああ、それは最近のMade By Googleイベントで発表された大きな革新の一つだのだ。Googleはその仮想アシスタントのアーセナルに画期的な追加を発表したのだよ。それが「Assistant with Bard」だのだ。この機能は、Pixel 8とPixel 8 Proとともに紹介され、AndroidとiOSユーザーに向けて、より強化された個人的な体験を約束しているのだ。

(OJ): それはすごいね!具体的にどんなことができるの?

(Neko): Assistant with Bardは、Google AssistantのスキルとBardの生成・推論能力を統合するのだ。この組み合わせにより、消費者に信頼性のあるだけでなく、文脈に応じた返答を提供する仮想アシスタントが生まれるのだ。例えば、「今週欠かした重要なメールを教えて」とスマホに頼むと、Bardを使用したアシスタントを使って、各メールの詳細な要約が、要点やオリジナルへの直接リンクとともに提供されるのだ。

(OJ): それは便利だね。でも、Google Assistantはもともとあったよね?

(Neko): そうだのだ。Google Assistantは、過去7年間で何億人もの人々が自然で会話的な方法でタスクを完了するのを助けてきたのだ。しかし、Bardの導入により、より知的で、より個人的で、より直感的なデジタルアシスタントを提供する新しい機会が生まれたのだ。そして、それは声だけでなく、さらに拡大するべきだと、シッシー・シャオ(Sissie Hsiao)氏はTechCrunchによれば述べているのだ。

(OJ): それにしても、この新しい機能のユーザーインターフェースはどうなっているの?

(Neko): それがまた面白いところだのだ。Assistant with Bardのユーザーインターフェース(UI)は、最も注目すべき特徴の一つだのだ。これは、標準のシートスタイルのインターフェースとは異なり、画面上に浮かぶ「会話型オーバーレイ」として設計されているのだ。このオーバーレイは、テキスト、音声、画像の入力を受け付けるので、さまざまな目的に非常に適応性があるのだ。

(OJ): すごいね!これからのスマートフォンのインタラクションが楽しみだ。

(Neko): まさにそうだのだ。Google Assistant with Bardはまだ初期段階にあるが、スマートフォンのインタラクションの未来には莫大な可能性があるのだ。Pixel 8とPixel 8 Proのユーザーは、その機能を最初に利用することができるだろうのだ。


AIとハリウッド: 著作権、ラベル付け、そして未来への一歩

(OJ): ねぇ、Nekoちゃん、最近のAIの動向について知ってるか?特にハリウッドや著作権に関する話を。

(Neko): ああ、それは最近のAIアップデートで取り上げられていたのだ。まず、ハリウッドの脚本家たちが5ヶ月近くにわたるストライキを終え、新しい合意に達したことを知っているか?

(OJ): うん、聞いたことある。それがAIとどう関係してるの?

(Neko): 実はその新しい合意、Minimum Basic Agreement (MBA) というものには、AIに関するいくつかの条項が含まれているのだ。例えば、スタジオはAIを使用して文学的な素材を書き直すことや、著者としてのクレジットを希釈することはできない。また、AIで生成された素材は「ソース」として使用できない。これは、スタジオがAIで初めて生成された作品を低い給料で脚本家に適応させることができないということを意味するのだ。

(OJ): それは面白いね。他にもAIに関する取り決めがあるの?

(Neko): そうだね。スタジオは脚本家に提供する素材の一部がAIによって作成されたかどうかを明らかにしなければならない。また、スタジオはAIの使用を義務付けることはできないが、脚本家がスタジオの同意を得てAIツールを使用することを選択することはできる。

(OJ): それはすごいね。でも、著作権の問題はどうなってるの?

(Neko): 良い質問だ。実は、著作家の作品が生成的なAIモデルのトレーニングに使用されるかどうかという問題は、多くの最近の著作権訴訟でも取り上げられているテーマなのだ。しかし、このMBAはその戦いを別の日に持ち越している。著作家は、著作家の素材をAIのトレーニングに利用することが、Minimum Basic Agreementや他の法律によって禁止されていると主張する権利を保留しているのだ。

(OJ): なるほど。他にもAIの業界での動きはあるの?

(Neko): はい、実際には。例えば、ソーシャルメディアのセンセーションであるTikTokは、クリエイターによってプラットフォームに投稿されたAI素材をラベル付けするための新しいツールや技術のコレクションを最近発表した。一つのツールは、クリエイターが「AIで生成されたコンテンツを投稿したときに、簡単にコミュニティに通知する」ことを可能にするものだ。もう一つの開発中のツールは、コンテンツが「AIで編集または作成された」と自動的に検出し、それに「AI生成」というラベルをプログラム的に付けるものだ。

(OJ): それは便利そうだね。AIのトレーニングに関して、データセットの所有者やAIモデルの開発者との間での取引はどうなってるの?

(Neko): 実際、一部の大きな(そしてしたがって価値のある)データセットの所有者は、AIモデルの開発者と直接ライセンス契約を交渉している。この夏にOpenAIShutterstockAssociated Pressと別々に結んだ取引がその例だ。


韓国のロボット産業ブーム:Doosan Roboticsの株価がデビューで倍増

(OJ): ねぇ、Nekoちゃん、Doosan Robotics Inc.って聞いたことある?

(Neko): ああ、それは韓国のロボット製造会社だのだ。実は、最近ソウルでの取引デビューで株価がほぼ倍増したのだ。4210億ウォン(約312百万ドル)を韓国の今年の最大の初公開で調達したらしいのだ。

(OJ): すごいね!それだけの金額を調達するって、どれだけの人気があるの?

(Neko): とても人気があるようだのだ。実際、デビュー日には株価が98%上昇して51,400ウォンで終了したのだ。一時は160%まで上昇したこともあるのだ。Doosan Co.というソウル上場企業が最大の株主で、先月26000ウォンで1620万株を売却したのだ。

(OJ): 韓国のロボット市場はどれくらい大きいの?

(Neko): 韓国は実は世界で最もロボットを採用している国だのだ。工業ロボットごとに10人の製造業従業員を雇用しているのだ。特に、Samsung Electronics Co.などの地元企業や政府が投資を増やしているので、ロボットメーカーの株は今年非常に人気があるのだ。

(OJ): Doosan Roboticsはどんなロボットを作っているの?

(Neko): 2015年に設立されたDoosan Roboticsは、工場の床を超えて人間と一緒に作業するロボットアームを専門に製造しているのだ。これらのマシンは、コーヒーやから揚げの製造から、空港でのビールの提供や荷物の取り扱いまで、さまざまなサービスで展開されているのだ。そして、IPOの収益は戦略的な買収や海外展開のために使用される予定だのだ。CEOのリュ・ジョンフンは、ロボットに移動性を持たせる技術を持つ企業の買収を検討しているとも話しているのだ。

(OJ): それは面白いね。この会社の将来はどう思う?

(Neko): この会社は非常に有望だと思うのだ。2022年には、Hyundai Motor Co.やLG Electronics Inc.を含む顧客から450億ウォンの売上を上げているのだ。韓国のロボット産業は今後も成長が期待されるのだ。


本日の論文 DSPy: 言語モデルの革命的な最適化 - 新しい時代のNLPシステムへの一歩

論文の内容

この論文は、DSPyという新しいプログラムモデルについて紹介しています。DSPyは、言語モデル(LM)のプロンプティング技術を抽象化し、テキスト変換グラフとしてのLMパイプラインを提供します。具体的には、DSPyはLMパイプラインをテキスト変換グラフ、つまり、宣言的モジュールを通じてLMが呼び出される命令的計算グラフとして抽象化するプログラムモデルを導入しています。

革新的なポイント

  1. システマティックなアプローチ: 従来のLMパイプラインは、試行錯誤を経て発見された「プロンプトテンプレート」を使用して実装されていました。DSPyは、このアプローチをより体系的にし、LMパイプラインの開発と最適化を助けます。

  2. テレプロンプターの導入: DSPyは、自動的にプロンプティングを最適化するための「テレプロンプター」という概念を導入しています。これにより、任意のDSPyプログラムを最適化して、指定されたメトリックを最大化することができます。

  3. 効果的な使用: DSPyを使用すると、GPT-3.5やllama2-13b-chatなどの言語モデルを効果的に使用することができます。短時間のコンパイルで、DSPyモジュールの組み合わせは、シンプルなプログラムの品質を大幅に向上させることができます。

(OJ): ねぇ、Nekoちゃん、DSPyって聞いたことある?

(Neko): ああ、それは宣言的言語モデルの呼び出しを自己改善するパイプラインにコンパイルするものらしいのだ。詳しく説明するのだ。

(OJ): それって何のために使うの?

(Neko): 言語モデル(LM)のプロンプティング技術を探索するMLコミュニティが急速に増えている中、DSPyはこれらのプロンプティング技術を抽象化して、テキスト変換グラフとしてのLMパイプラインを提供するのだ。これにより、複雑なタスクを解決するためのパイプラインを効果的に構築できるのだ。

(OJ): それは面白そうだね。でも、どうやってそれを実現しているの?

(Neko): DSPyは、LMパイプラインをテキスト変換グラフ、つまり、宣言的モジュールを通じてLMが呼び出される命令的計算グラフとして抽象化するプログラムモデルを導入しているのだ。これにより、プロンプティング、微調整、拡張、および推論技術の組み合わせをどのように適用するかを学ぶことができるのだ。

(OJ): それはすごい!でも、どんな利点があるの?

(Neko): まず、DSPyは言語モデルの呼び出しを最適化するためのシステマティックなアプローチを提供するのだ。従来のLMパイプラインは、試行錯誤を経て発見された長い文字列である「プロンプトテンプレート」を使用して実装されていた。しかし、DSPyはこのアプローチをより体系的にすることで、LMパイプラインの開発と最適化を助けるのだ。

(OJ): それは効率的に聞こえるね。他にも特徴はあるの?

(Neko): はい、DSPyは自動的にプロンプティングを最適化するための「テレプロンプター」という概念も導入しているのだ。これにより、任意のDSPyプログラムを最適化して、指定されたメトリックを最大化することができるのだ。

(OJ): これは革命的だね!DSPyを使うと、どんな結果が得られるの?

(Neko): DSPyを使用すると、GPT-3.5やllama2-13b-chatなどの言語モデルを効果的に使用することができるのだ。実際、短時間のコンパイルで、DSPyモジュールの組み合わせは、シンプルなプログラムの品質を大幅に向上させることができるのだ。

この記事が気に入ったらサポートをしてみませんか?