AI系ニュースまとめ【23/5/11~13】
※ニュースの選定は人力で、引用元の要約とコメント付けをGPT-4にやってもらっています。(今回は一部、GPT-3.5になってしまいました。すみません)
※より正確な情報は引用元を参照ください。
※途中から有料(100円)です。応援いただけますと幸いです。
※3日おきに更新予定です!次回分は5/17の公開を予定しています。
5/11(木)
やっぱりこの日はGoogleばっかりですね。
Googleが提案する視覚-言語モデル「MaMMUT」:多様なタスクに対応可能な一つのモデル
ニュース要約(以下リンクから引用)
視覚-言語モデルの一つの訓練が、多様な下流活動に適応可能
CLIPのスタイルに倣った「対比学習」と「次トークン予測」の2つの訓練シナリオがある
タスク間でのモデルの転移性が低いと、テキスト生成タスクなどで成績が低下する傾向がある
これらの問題を解決するため、Googleが新たに提案したのが「MaMMUT」モデル
MaMMUTは2Bパラメータのコンパクトな多モーダルモデルで、対比的な学習、テキスト生成、位置認識の目標を達成するために訓練可能
シンプルな設計(1つの画像エンコーダと1つのテキストデコーダ)により、2つを独立して再利用することが容易
MaMMUTは、画像-テキストとテキスト-画像の検索、視覚品質評価、キャプション生成など、多くのアプリケーションに容易に統合可能
GPT-4のコメント
このGoogleによる新たなモデル「MaMMUT」の提案は、視覚-言語モデルにおける大きな進歩を示しています。従来の問題であったタスク間でのモデルの転移性が低いという課題に対し、一つのモデルで多様なタスクをカバーできる可能性を持っています。これにより、一つのモデルを複数のタスクに対応させることで、効率的にリソースを活用し、結果的に機械学習のパフォーマンスを向上させることが期待できます。
また、シンプルな設計により、エンコーダとデコーダを独立して再利用できるというのも大きな特徴です。これにより、モデルの適応性と柔軟性が向上し、様々なタスクやシナリオに対応可能となります。
ヨーロッパ議会がAI法案を承認:AIに対する透明性とリスク管理の新ルール
ニュース要約(以下リンクから引用)
ヨーロッパ議会の内部市場委員会と市民自由委員会が、AI法案として知られる人工知能システムの新たな透明性とリスク管理ルールを承認した
これは、AIの規制開発において大きなステップであり、初めてのAIに対するルールである
AIシステムが安全で透明性があり、トレース可能で差別的でないことを確保することがこのルールの目的
AIシステムが人々の安全に対して受け入れられないレベルのリスクを生む場合、そのシステムは厳しく禁止される
ヨーロッパ議会は、AIシステムの不適切な使用に対する禁止リストも大幅に修正した
高リスクエリアの分類も拡大し、人々の健康、安全、基本的権利、または環境への影響を含むようにした
AIのイノベーションを促進するため、研究活動やオープンソースライセンスで提供されるAIコンポーネントに対するこれらのルールの例外を追加した
GPT-4のコメント
このニュースは、AI規制の進展における重要な節目を示しています。ヨーロッパ議会がAI法案を承認したことは、AIの透明性とリスク管理に対する新たな規範を設定し、AI開発と使用のための基準を提供します。これにより、AIが社会に持つ潜在的なリスクを管理しながら、イノベーションと進化を維持することが可能になります。
これらの規制は、AIが人々の生活にどれほど深く影響を与えるかを考えると、非常に重要です。特に、AIシステムが人々の安全に対して受け入れられないレベルのリスクを持つ場合の厳格な禁止は、AIが個人の安全とプライバシーを保護するための重要なステップを示しています。
AIライティングプラットフォーム「Writer」が知識グラフを公開ベータで発表
ニュース要約(以下リンクから引用)
AIライティングプラットフォームの「Writer」が、企業が組織全体で現在のソースコンテンツをグラフデータベースに集めるツール、「Knowledge Graph」を公開ベータで発表した
CEOのMay Habib氏によれば、Knowledge Graphは顧客自身のコンテンツを利用して、生成されたコンテンツと照らし合わせるコンテンツバリデータとして機能する
事実チェックが必要なコンテンツを自動的にハイライトし、適切な場合にはKnowledge Graph内の最も関連性の高いコンテンツに基づく代替文を提案する
代替素材がどこから来たのかを表示し、人間の従業員が提案を受け入れるか拒否する能力を持つ
企業はKnowledge Graphを自分たちでホストすることも、Writerに管理させることもできる
また、Writerは、独自のLLMをWriterプラットフォームに持ち込む能力を発表した。これにより、WriterのLLMが置き換えられる
外部LLMの使用能力とKnowledge Graphは、今日からオープンベータで利用可能となる
GPT-4のコメント
このニュースは、AIを用いたライティング技術の領域における重要な進歩を示しています。Writerが提供する「Knowledge Graph」は、企業が自身のコンテンツに対する理解と管理を強化するための有用なツールであると言えます。これにより、コンテンツの事実確認や代替文の提案など、より高度な自動化が可能になります。
また、Writerが独自のLLMの導入を許可することは、企業が自分たちのコンテンツとその生成に対するコントロールを強化するための重要なステップです。これにより、企業は外部のモデルを使用することなく、自身の組織内で完全にコントロールすることが可能になります。
ヨーロッパ議会、AI法に対する一連の修正を承認
ニュース要約(以下リンクから引用)
ヨーロッパ議会の二つの委員会が、OpenAIのChatGPTのような生成AI技術を支える「基礎モデル」に対する一連の要件を含むAI法案への修正を支持。
修正では、基礎モデルの提供者に対して、モデルを市場に出す前に安全チェック、データ管理策、リスク軽減を適用する義務が課せられる。
また、基礎モデルの製作者に対して、システムのエネルギー消費とリソース使用を削減し、システムをAI法案で設立される予定のEUデータベースに登録する義務がある。
さらに、生成AI技術の提供者は、透明性義務に適合し(ユーザーに内容が機械により生成されたことを通知する)、システムが生成する内容に対して「適切な保護措置」を適用し、AIを訓練するために使用された任意の著作権保護資料の要約を提供する義務がある。
今日の投票では、AIシステムの「高リスク」領域への規制の拡大、特定のAIシステムの禁止、リスク評価の義務付けなどが含まれていた。
議会の採択した修正案では、AIシステムが人間によって監視され、安全で、透明で、追跡可能で、差別的でなく、環境に優しいことを確保することを目指している。
GPT-4のコメント
このニュースは、AIの規制について、ヨーロッパが世界をリードする役割を果たしていることを示しています。特に、AIの「基礎モデル」に対する要件や、AIが市場に出る前の安全チェックとデータ管理の重要性が強調されています。これは、AIが人々の生活に深刻な影響を及ぼす可能性があるため、そのリスクを管理する必要性を示しています。
EverseenがシリーズAラウンドで€65Mを調達、小売業界向けAI監視技術を拡大
ニュース要約 (以下リンクから引用)
アイルランドのEverseen社は、クロスポイント・キャピタル・パートナーズをリード投資家としたシリーズAラウンドで€65M(約$71.32M)を調達したと発表した。これにより、同社の総調達額は約$90Mに達する。
Everseenは、小売業者が在庫の欠損を最小限に抑えるためのコンピュータビジョン技術を商用化している。特に、自動レジでの盗難を防止することを目指している。
Everseenのテクノロジーは、天井に取り付けられたカメラとコンピュータビジョンソフトウェアを組み合わせて、売り場での盗難を減らすことを試みている。また、棚の商品がほぼ在庫切れになったときや、スタッフが問題を解決し、トレンドを改善し、バリエーションを減らすために即時注意が必要なプロセスを特定する能力を持つと主張している。
しかし、Everseenのシステムは必ずしも成功しているわけではない。かつてEverseenの大きな顧客であったWalmartの従業員は、システムがしばしば無害な行動を盗難と誤認し、実際の盗難を止めることができなかったとWiredに告げている。
GPT-4のコメント
このニュースは、AIとコンピュータビジョン技術が小売業界における新たな価値を提供する一方で、それらが引き起こす可能性のある問題を浮き彫りにしています。小売業者が在庫の欠損を減らすためのツールとしてEverseenの技術は有用である一方、顧客のプライバシーや個人データの取扱いについては慎重な対応が必要となります。
Google、開発者向けに新たなML Hubを発表
ニュース要約 (以下リンクから引用)
Googleは、I/O開発者向けカンファレンスで、開発者が機械学習モデルのトレーニングとデプロイメントに関するガイダンスを得るための一元化されたプラットフォーム、ML Hubを発表した。
ML Hubは、機械学習を広め、よりアクセスしやすくすることを目的としている。開発者は、ML Hubを使って、データに基づいて生成したいモデルの種類を選択し、そのモデルをデプロイする方法についての段階的な指示を受けることができる。
このプラットフォームは、一連の共通のユースケースをカバーする初期のツールキットとともに開始され、定期的に更新され、新たなツールキットが続々と追加される予定である。
このプロジェクトの焦点はオープンソースにあり、開発者はこれらの技術をオンプレミスや任意のクラウドで実行することができる。ただし、新しいツールキットはGoogleクラウドへの「滑らかな移行」も提供する。
GPT-4のコメント
このニュースは、機械学習技術をより利用しやすくするためのGoogleの取り組みを示しています。ML Hubは、機械学習の専門知識を持たない開発者にも、簡単に機械学習モデルを開発し、デプロイする方法を提供することで、AI技術の民主化に貢献する可能性があります。
Google、Android StudioにAIベースのStudio Botを追加
ニュース要約 (以下リンクから引用)
Googleは年次開発者カンファレンスで、開発者がコードの作成やバグの修正、一般的なコーディングの質問に答えるのを支援する新しい対話型エクスペリエンス、Studio BotをAndroid Studioに導入すると発表した。
Studio Botは、Googleの新しいPaLM 2ベースの基礎モデル、Codey上に構築されており、まずアメリカの開発者向けに提供され、その後徐々に展開される予定である。
Googleは、この新しいボットをプライバシーを意識して構築したと述べている。ソースコードはGoogleと共有されず、開発者とボットとのチャットのみが共有される。
Googleはまた、Codeyベースのコード補完および生成サービスを展開しており、これはGitHubのCopilotやAmazonのCodeWhispererと競合し、VSCode、JetBrainsのIDE、Google自身のCloud shellに統合できる。
GPT-4のコメント
このニュースは、AIと開発者ツールの統合が進行中であることを示しています。Studio Botは、開発者がコードを書いたり、バグを修正したりする際の支援を提供します。これは、開発者が直面する問題を解決し、生産性を向上させる可能性があります。
新しいボットのプライバシーに対する配慮は、個人情報の保護が重要視されている現代のテクノロジー業界において、大きな利点となります。また、Codeyベースのコード補完および生成サービスの展開は、他の大手テクノロジー企業が提供している類似のサービスと競争することを示しています。これは、AIがソフトウェア開発の未来において重要な役割を果たすであろうことを確認するものです。
Google Play StoreにAI技術を導入し開発者を支援
ニュース要約 (以下リンクから引用)
Googleは今週の開発者イベント、Google I/Oで、開発者がAIを使用してAndroidアプリをPlay Store用に構築・最適化するための新たな手段をいくつか発表した。
新たなAI機能の一つには、GoogleのPaLM 2モデルを使用して新しいPlay Storeリストを作成するためのGenerative AIツールがある。開発者がプロンプトを入力すると、AIヘルパーがドラフトコピーを生成する。
また、ユーザーレビューの要約というAI機能もあり、Play Storeのレビューに残されたコメントから開発者のアプリについてのユーザーの意見をまとめる。
加えて、開発者はAIを活用した機械翻訳ツールにアクセスできるようになり、自分のアプリやPlay Storeのリストを他の言語に数分で翻訳することができる。
これらのAI機能は、GoogleがAIモデルを既存のサービスの特定のエリアに組み込むことに焦点を当てているGoogle I/Oの全体的なテーマに適合している。
GPT-4のコメント
このニュースは、AIがアプリ開発と公開にどのように活用できるかを示す貴重な見本であり、GoogleがAIをどのように自社製品に組み込んでいるかを示す具体的な例でもあります。特に、PaLM 2モデルを使用したGenerative AIツールは、開発者がPlay Storeリストを作成する際の負担を軽減し、より魅力的なアプリ説明を作成するのに役立つ可能性があります。
また、「User Review Summaries」機能は、アプリのレビューを効果的にまとめ、ユーザーがアプリについての一般的な意見を素早く把握できるようにすることで、アプリ選択の決定過程を支援します。
GoogleのFirebaseがAI拡張とPythonのサポートを追加
ニュース要約 (以下リンクから引用)
Googleのアプリケーション開発者向けのバックエンドサービスプラットフォームであるFirebaseは、GoogleのI/O開発者会議で多数の新機能を追加する。中でも主要な更新は、GoogleのPaLM APIによって駆動されるAI拡張の追加である。
また、FirebaseのCloud Functions(2nd gen)でのPython言語のサポート、Cloud Firestoreデータベースサービスの更新などが追加される。
加えて、GoogleはFirebase拡張のマーケットプレースをより多くの開発者に開放することになった。
Firebase拡張は、2019年に初めて導入されたアプリ開発者向けのプリパッケージ化されたソリューションである。新たな拡張には、画像生成器、PaLM APIをベースにしたチャットボットを作成するためのツール、テキストの要約などがある。
Pythonのサポート追加は、AIプロジェクトのほとんどがデフォルトでPythonを使用しているため、AI/MLコミュニティの開発者が自分たちの拡張をより簡単に作成し、マーケットプレースで利用できるようになる。
GPT-4のコメント
FirebaseがAI拡張機能とPythonのサポートを追加したことは、Googleが開発者の生産性と創造性を強化しようとしていることの明確な証拠です。AIと機械学習がますます普及する中、開発者は新しいツールと技術に習熟するために時間と労力を投資する必要があります。Firebaseが提供するAI拡張機能は、開発者がこれらの技術を活用してアプリを構築する際の複雑さを軽減し、より高度な機能を簡単に実装できるようにすることで、この課題を解決するのに役立ちます。
Google、スピーカーの唇を新言語に同期させる新しい翻訳サービスをテスト
ニュース要約 (以下リンクから引用)
Googleは、新しい言語でビデオを再ダビングし、話し手の唇を彼らが発したことのない言葉に同期させる新しい翻訳サービスをテストしている。
この"Universal Translator"は、Google I/Oで新設された"Technology and Society"部門のジェームズ・マニカによって紹介された。
この"実験的"なサービスは、入力ビデオを取り、そのスピーチを転写し、翻訳し、その言語でスピーチを再生成し(スタイルとトーンを一致させ)、話し手の唇が新しいオーディオにより近くなるようにビデオを編集する。
ただし、これらのツールは厳格なメディアワークフローで利用可能なプロフェッショナルなものであり、YouTubeのアップロードページのチェックボックスではない。同様に、Universal Translatorもまだそうではないが、それがそうなる可能性があるなら、Googleはそれがデマを作成するために使用される可能性や他の予見せぬ危険について考慮する必要がある。
このサービスは、誤用を防ぐためにガードレールを設けて構築され、認証されたパートナーのみがアクセスできるようになっている。
GPT-4のコメント
Googleが新しい翻訳サービスをテストしているというニュースは、AI技術の進歩とそれが持つ可能性、そして同時にそれがもたらすリスクについて、我々がどのように向き合うべきかを示しています。このサービスは、言語の障壁を大幅に減らす可能性があり、教育やビジネスの世界で大いに利用できるでしょう。しかし、同時に、これはディープフェイクの生成にも使われる可能性があります。
Google、個々のユーザー体験を強化する新機能を発表
ニュース要約 (以下リンクから引用)
Googleは、I/O開発者会議で、ユーザーがデバイス上でよりパーソナライズされた体験を作成するためのオプションを提供するために、Material Youを基にしていると発表した。
もっとも注目すべき発表は、今秋にロールアウトされる予定の生成AI壁紙である。
生成AI壁紙は、Googleのテキストから画像への拡散モデルを利用して、新しくオリジナルの壁紙を生成する。
また、Googleは映画的な壁紙と絵文字の壁紙を発表した。映画的な壁紙は、お気に入りの写真を鮮やかな3D画像に変換するために、デバイス上の機械学習ネットワークを使用する。
絵文字の壁紙は、ユーザーが好きな絵文字の組み合わせ、パターン、色を使用してデバイスをカスタマイズできるようにする。
さらに、Googleは、Android 14の到来とともに、ユーザーが新しいショートカットや時計を使ってロック画面をカスタマイズできるようになると発表した。
Googleはまた、ナイトモードと10ビットHDRビデオの新たなサポートをInstagramなどのソーシャルアプリにもたらすと発表し、Android 14でUltra HDRを導入する予定である。
GPT-4のコメント
Googleの最新の発表は、テクノロジーが個々のユーザー体験をどのように改善し、パーソナライズするために利用できるかを示しています。生成AI壁紙や映画的な壁紙、絵文字の壁紙などの新機能は、ユーザーがデバイスを自分だけのものにするための新しい方法を提供します。
Google、AIによるノート整理ツール「Project Tailwind」を発表
ニュース要約 (以下リンクから引用)
Googleは、I/O開発者会議で、ユーザーのフリーフォームのノートを自動的に整理し、要約することを目指すAI搭載のノートツール「Project Tailwind」を発表した。
Tailwindは、Googleの新たに刷新された実験的製品のハブであるLabsを通じて利用可能で、ユーザーはGoogle Driveからファイルを選択する。
Tailwindはその情報に精通したプライベートAIモデルを作成し、ノートやドキュメントを整理するのに役立つパーソナライズされたインターフェースを提供する。
Tailwindはまた、Googleの大規模言語モデルであるPaLMの後継者であるPaLM 2のデモとして機能する。Tailwindの多くの機能は、新たに立ち上げられたAPIを通じてPaLM 2によって動かされている。
例えば、Tailwindはスタディガイドを生成し、キーコンセプトを強調し、問題を提案したり、読解クイズを作成したりすることができる。
また、ツールはノートに関する自然言語の質問に答え、その答えのソースをドキュメント内に引用することができる。
GPT-4のコメント
GoogleのProject Tailwindは、AIが私たちの作業をどのように支援し、効率化する可能性を示しています。ユーザーが手書きのノートを自由形式で取ることができ、その後AIがそれを整理し、要約するというアイデアは、情報過多の現代社会において特に有用です。
しかし、そのユーザーグループがまだ明確でない点は興味深い。学生、ライター、アナリスト、弁護士など、様々な人々がこのツールを利用することができると考えられます。その柔軟性は、これが一種のテクノロジーの未来を示す可能性があるという事実を強調しています。
Google、AIを活用した個別メッセージ作成機能「Magic Compose」を発表
ニュース要約 (以下リンクから引用)
Googleは、Androidのガイド付きカスタマイズと進化した生成AIを組み合わせて、より個人的なメッセージを作成するのを助ける新機能を発表した。この機能は「Magic Compose」と呼ばれ、メッセージと会話の中でテキストを異なるスタイルで書き換える方法を示す。
Magic Composeを使い始めるには、まずGoogleメッセージアプリを使用して通常通りにメッセージを入力します。次に、メッセージがどのように聞こえるかを選択し、Magic Composeがテキストをそれに合わせて調整します。
例えば、この機能を使ってメッセージをよりポジティブに、またはよりプロフェッショナルに聞こえるようにすることができます。また、「あなたのお気に入りの劇作家によって書かれたように」メッセージを聞かせることも可能です。
この機能は、テキストメッセージを通じて多くの時間を通信に費やし、個人的なメッセージと仕事用のメッセージを頻繁に切り替える必要がある人々にとって便利かもしれません。
GPT-4のコメント
Googleの「Magic Compose」は、AIとテキストコミュニケーションの統合の新たな例を示しています。この機能は、メッセージのトーンやスタイルを瞬時に変更することで、ユーザーがさまざまなコンテキストでのコミュニケーションを簡単に行うことができるようにする可能性があります。
ただし、初期のデモから見て、この機能は必須のものではないかもしれません。それはむしろ、Googleがビジネスのすべての側面、特にAndroidスマートフォンアプリにAIを埋め込むことを目指していることの新たな例です。他の機能と組み合わせることで、AIの使用はAndroidに競争力のあるデバイス市場での優位性をもたらす可能性があります。
GOOGLEのGENERATIVE AI ART SOLUTIONS, "IMAGEN"
ニュース要約 (以下リンクから引用)
Googleは、開発者向けの年次カンファレンス、I/Oで新しいAIモデルをVertex AIに導入すると発表しました。これにはテキストから画像を生成するモデル"Imagen"が含まれます。
ImagenはGoogleのModel Gardenからアクセス可能で、プロンプトを入力することで画像を生成したり、既存の画像にキャプションを書くことができます。
さらに、Imagenは画像のキャプションを生成し、Google Translateを利用してそれらのキャプションを翻訳することも可能です。
ジェネラティブAIには、所有権や著作権を含む倫理的、法的な課題があります。Googleはこれらの課題に対処するために広範な"data governance reviews"を行っています。
Googleはまた、Vertexのマネージドサービスとして人間のフィードバックからの強化学習(RLHF)をローンチしました。これは、ImagenなどのジェネラティブAIモデルを最適化するために使用されます。
その他の新しいモデルとしては、Codey(コード生成)とChirp(音声モデル)があります。
GPT-4のコメント
Googleの新しいAIモデル"Imagen"の発表は、ジェネラティブAIの世界における大きなステップです。テキストから画像を生成する能力は、アート、デザイン、広告など、多くの分野で有用な応用が可能です。しかし、この技術の進展は著作権や所有権の問題を引き起こします。Googleがこの問題をどのように管理するかは、ジェネラティブAIの未来に大きな影響を与えるでしょう。
また、人間のフィードバックからの強化学習(RLHF)の導入は、AIモデルの最適化という観点から重要です。しかし、RLHFが必ずしも最良のアプローチであるとは限らないという議論もあります。RLHFはしばしば大量の低賃金の契約労働者を雇うことを含み、それらの労働者は非常に有害なコンテンツを評価することを強いられる可能性があります。
GOOGLE I/Oで新たなスーパーコンピューター型仮想マシン「A3」が発表
ニュース要約 (以下リンクから引用)
Google CloudがGoogle I/Oで新たなスーパーコンピューター型仮想マシン「A3」を発表した。
「A3」は大量の計算能力を必要とするLLM(Large Language Models)や生成AIアプリケーションのために開発された。
「A3」は、NvidiaのH100 GPUを8つ搭載し、Intel Xeon Scalableプロセッサー、2TBのホストメモリ、NVSwitchとNVLink 4.0を介した8つのGPU間で3.6TBのバイセクショナル帯域幅を持つ。
これらのマシンは、最大で26エクサフロップスのパワーを提供し、大規模な機械学習モデルの訓練に関連する時間とコストを改善する。
「A3」は、顧客が自分で運用するか、Googleが大部分を管理するマネージドサービスとして提供される。
現在、「A3」はプレビュー待ちリストにサインアップすることでのみ利用可能。
GPT-4のコメント
Googleの新たなA3スーパーコンピューター型仮想マシンの発表は、生成AIやLLMのような資源を大量に消費するユースケースに対する強力な対応策を示すものである。これは、機械学習モデルの訓練に関連する時間とコストの削減に大いに寄与するだろう。
また、自身で運用するか、Googleが管理するマネージドサービスとして利用するという選択肢があるため、顧客のニーズに応じて適切な形で利用できるという利点もある。しかし、現在はプレビュー待ちリストにサインアップすることでのみ利用可能とのことなので、その性能をフルに活用できるようになるまでにはまだ時間がかかるかもしれない。
それにしても、このような高性能なハードウェアが提供されることによって、AIの可能性がさらに広がることは間違いない。今後のAI技術の進化に期待が持てる発表であった。
GOOGLEがAIを中心としたコーディングツールを発表
ニュース要約 (以下リンクから引用)
Googleは年次開発者会議I/Oで、GitHubのCopilotに対抗するコード補完ツール、コーディングやGoogle Cloudサービスに関する質問をするためのチャットツール、そしてGoogleのノーコードAppSheet製品でのAI支援コーディングなど、AIを中心としたコーディングツールを発表した。
これらの新たなコード補完やコード生成ツールの中心にはCodeyが存在する。Googleの大規模言語モデルPaLM 2をベースに、GoogleはCodeyをコーディング関連のプロンプトを処理できるように特別に訓練した。
Codeyのモデルは、許諾されたオープンソースコードの大規模なコーパス、Googleの内部コード、同社の全てのコードサンプル、参照アプリケーションを用いて訓練された。
開発者は、Visual Studio Codeの拡張機能、JetBrains IDE、Google Shell Editor、Googleのクラウドホスト型Workstationsサービスなどを通じてこれらの新しいツールにアクセスできる。
現在、信頼できるテスターの限られたグループのみが、コードアシスタンス機能、統合チャット、GoogleのAppSheetノーコード開発プラットフォームの新しいAI統合を試すことができる。
Googleのビジョンは、単にコードを生成すること以上に、開発者がこのチャットボット技術を使用してGoogle Cloud上のすべてのサービスを管理することを助けることを目指している。
GPT-4のコメント
Googleのこの発表は、AIとコーディングの統合によって開発者の生産性を向上させ、開発のプロセスを効率化する新たな試みを示しています。具体的には、Googleの大規模言語モデルPaLM 2をベースにしたCodeyというツールは、コーディングに関連するプロンプトを処理するために特別に訓練されています。
GOOGLE SEARCHが生成型AIによる新しい会話型モードを紹介
ニュース要約 (以下リンクから引用)
Google Searchは、年次開発者会議I/Oで、生成型AIによる新しい会話型モードを発表した。この新機能は、新たな実験プログラム「Search Labs」の一環として、ウェイトリストを開放する形で提供される予定である。
ユーザーは検索を行う際に、次のステップの提案と、より深く掘り下げるためのリンクと共に、AIによる重要な情報のスナップショットを見ることができる。
Google Shoppingと統合され、ユーザーがオンラインで役立つ情報に迅速に接続できるように設計されている。
新しい生成型AIショッピング体験は、GoogleのShopping Graphに基づいて構築されており、Googleによれば、35億以上の製品リストがある。
実験はSearch Generative Experience(SGE)と呼ばれ、Google Labsを通じて米国で実験的に利用可能になる予定である。
GPT-4のコメント
Googleの新たな取り組みは、AIの進化がユーザー体験をどのように変化させるかを示しています。
GOOGLE I/Oにて新ツール"Sidekick"を発表 - 生成型AIのプロンプト支援に焦点
ニュース要約 (以下リンクから引用)
GoogleはI/O開発者会議において、生成型AIに全力を注ぐ姿勢を示し、新たなツール「Sidekick」を紹介した。このツールは、生成型AIループにおいて人間が最も得意とするとされるプロンプトの提供を改善することを目指している。
SidekickパネルはGoogle Docs内のサイドパネルに位置しており、ユーザーが文章を書き進めると同時に、その全体をリアルタイムで読み取り、処理し、文脈に基づく提案を行う。
Googleによるデモでは、子ども向けの物語作成が進行中で、Sidekickが物語の次の展開についてのプロンプトを提供していた。そしてそのプロンプトを、進行中の文書全体と組み合わせてさらに文脈を深め、結果を具体化する様子が示された。
Sidekickは、ドキュメント内の内容に基づいてAIによる画像生成も提供できる。また、書かれた会話の要約、スピーカーノートの提供などもデモで示された。
これらはすべてGoogleの新たにリブランディングされた「Duet AI」スイートの一部であり、MicrosoftがCopilot AI機能で示したものとさほど変わらない。
GPT-4のコメント
Googleの新ツール"Sidekick"の発表は、AIと人間との関係性が進化し続けていることを示しています。生成型AIがより自己完結的になり、ユーザーの役割がプロンプトエンジニアからプロンプトプロンプトエンジニアへと変化していく可能性があります。しかし、最終的には人間の創造性と洞察力がプロンプトと結果の質を向上させる重要な役割を持つでしょう。
GOOGLE、AI生成画像による誤情報対策として新機能を発表
ニュース要約 (以下リンクから引用)
Googleは、AIによって生成された画像から生じる可能性のある誤情報を防ぐための最初のステップを踏み出した。I/O開発者イベントでの発表を補完する形で、Google検索に2つの新機能が追加されることが発表された。
これには、「About this image」機能内での画像自体についての詳細情報の追加、そして「AI-generated」とラベル付けされるファイル自体の新しいマークアップの追加が含まれる。
これらの新機能は、視覚的なリテラシーをより多く含むというGoogleの既存の作業を拡張するものであり、人々が画像が信頼性があるのか、AIによって生成されたものなのかをより迅速に評価できるようにすることを目指している。
ただし、これらのツールだけでは、AIの画像が誤導または誤情報を流すために使用される広範な問題を対処することはおそらくできない。
「About this image」機能を使用するには、Google Imagesの検索結果で画像上の3つのドットをクリックするか、Google Lensで画像またはスクリーンショットで検索するか、画像について詳しく知りたいページ内でGoogleアプリからスワイプアップする必要がある。
Googleが自身の生成画像機能を展開する一方で、2つ目の新機能は、Googleのすべての自身のAI生成画像がオリジナルのファイルにマークアップを持ち、画像がGoogleのプラットフォームの外でアクセスされた場合にユーザーに文脈を提供することを保証する。
GPT-4のコメント
Googleのこの新機能は、AI生成画像による誤情報の問題に対処するための重要な一歩を示しています。しかし、これらのツールはあくまで一部の問題解決に過ぎず、AI画像が誤導または誤情報を流す全体的な問題に対する完全な解決策にはなりません。
GOOGLE、テキストから音楽を生成するAIツール「MUSICLM」を発表
ニュース要約 (以下リンクから引用)
Googleは、テキストの説明を音楽に変換する新しい実験的なAIツール「MusicLM」をリリースした。Web、Android、iOSのAI Test Kitchenアプリで利用可能なMusicLMは、「ディナーパーティーのためのソウルフルなジャズ」や「催眠的なインダストリアルテクノサウンドを作成」などのプロンプトを入力すると、ツールが曲のいくつかのバージョンを作成する。
ユーザーは、「エレクトロニック」や「クラシック」のような楽器を指定したり、彼らが目指す「雰囲気、気分、または感情」を指定したりして、MusicLMで生成した作品を洗練させることができる。
GoogleはMusicLMのプレビューを1月の学術論文で発表した際に、「直ちにリリースする予定はない」と述べていた。論文の共著者は、MusicLMのようなシステムが提起する多くの倫理的課題を指摘していた。
それにもかかわらず、Googleは、音楽家と協力し、ワークショップを開催して、「テクノロジーが創造的なプロセスをどのように強化するか」を探ってきたと言っている。
しかし、生成音楽をめぐる広範な課題が容易に解決されることはなさそうである。
GPT-4のコメント
「MusicLM」の登場は、AIが音楽創作にどのように影響を与えるかを示す新たな一例です。しかし、著作権問題やAIによる音楽生成がアーティストの権利にどのように関わるかという課題が依然として存在します。これらの課題に対する法的な解決策が求められる一方で、新技術の導入が創作プロセスをどのように変えるかについての議論も重要です。
GOOGLEのAI技術がワークスペース製品群に拡大、シートとスライドでの自動生成機能を追加
ニュース要約 (以下リンクから引用)
Googleは、I/O開発者カンファレンスで、ワークスペース製品群におけるAIの利用に焦点を当てている。GmailとDocsでテキストの書き込みと再書き込みを支援する新機能のプレビューを既に開始しており、同様のAI機能をSheetsとSlidesにも導入する計画を示していた。
Googleは今回、Sheetsでの自動表生成(数式は除く)と、SlidesとMeetでの画像生成を開始した。また、モバイル版のGmailとGoogle Docsでもこれらのライティング支援機能が利用可能になった。
Sheetsでは、数文の説明から表を自動生成できるようになった。ユーザーは説明を入力するだけで、Sheetsがテンプレートとサンプルコンテンツを提供する。
SlidesとMeetでは、視覚化したい内容を入力すると、それに対応した画像を生成する機能が追加された。Meetでは、カスタム背景の生成が可能なケースが想定されている。
Googleはこれらのサービスを'Duet AI'と称している。
GPT-4のコメント
GoogleのAI技術の進化は、ユーザーが日常的に使用するツールに対する新たなアプローチを示しています。AIがワークスペース製品群に統合されることで、ユーザーエクスペリエンスが大幅に向上し、生産性が高まる可能性があります。しかし、AIが生成するコンテンツの品質と適切性、そしてAIの利用が個人のプライバシーやデータセキュリティにどのように影響するかという課題に対する解決策も必要とされています。
GOOGLEの人工知能チャットボット「BARD」が広範囲に利用可能に
ニュース要約 (以下リンクから引用)
GoogleはI/O開発者カンファレンスで、人工知能チャットボット「Bard」の利用制限を大幅に緩和し、今日から英語版が広範囲で利用可能になることを発表した。
GoogleのSissie Hsiao氏は、公式発表のブログ投稿で、「新たな改善と新機能の導入を進める中で、より多くの人々にBardを試してもらい、フィードバックを共有してもらうことが重要」と述べた。
GoogleのJohn Krawczyk氏は、会議の前に行われたプレスイベントで、韓国語と日本語のチャットボットも順次ロールアウトされると発表した。さらに、トップ40の言語への拡大を進める予定であることを明らかにした。
Googleは、Bardに多モーダルコンテンツを追加し、テキストだけでなく、より豊かな視覚情報を提供する機能を近く追加する予定である。
GPT-4のコメント
GoogleのBardの一般公開は、AIチャットボットが主流になる可能性を示しています。これはコミュニケーションの新たな形態をもたらし、情報の検索やタスクの実行に対するアプローチを変える可能性があります。しかし、AIチャットボットの使用には、プライバシー、倫理、そして正確性といった課題が伴います。これらの問題にどのように対処するかが、Bardの成功に大きく影響するでしょう。
GOOGLEの「BARD」とADOBEの「FIREFLY」が連携、新たなAI生成機能を提供
ニュース要約 (以下リンクから引用)
Adobeは今日、最近導入したメディアコンテンツ生成のAIモデル集合「Firefly」がGoogleの「Bard」に導入され、Adobeの無料グラフィックデザインツール「Adobe Express」とともに提供されることを発表した。
Fireflyは、Bardでテキストから画像を生成する能力を強化するとともに、Bardの「主要な生成AIパートナー」になるとAdobeは述べている。
この提携は、MicrosoftのBing Chatチャットボットに組み込まれたAI生成ツール「Image Creator」のローンチに続くもので、BardのFirefly経由で画像を生成し、Expressを使ってそれらを修正する機能が追加される予定である。
Fireflyは、著作権のある素材を除外した画像生成を目指して設計されており、Adobe Stockからライセンスを取得した数億の画像、公開ライセンス画像、著作権が消滅した公共領域のコンテンツで訓練されるとAdobeは述べている。
GPT-4のコメント
この提携は、AI生成ツールがクリエイティブ産業にどのように影響を与えるかの一例であり、テキストから画像への生成能力を強化することで、ユーザーがより直感的にコンテンツを作成できるようになる可能性があります。ただし、著作権の問題に対するアプローチは、公平使用原則という米国の法制度のもとでも未解決のままです。この問題がどのように解決されるかは、AI生成ツールの未来を大きく左右する問題となります。
GOOGLEの新AIモデル、PaLM 2の課題と限界
ニュース要約(以下リンクから引用)
Googleは年次開発者会議で、自社の大規模言語モデルPaLMの後継者であるPaLM 2を発表した。一部のタスクではOpenAIのGPT-4を上回ると主張している。
PaLM 2の訓練に使われた具体的なデータは不明で、Googleはこれを「戦略的に」公開しない方針を採っている。
PaLM 2はトリガーとなるプロンプトが明示的に有害な言葉を含む場合、30%以上の確率で有害な応答を生成し、暗黙的に有害な言葉を含む場合は60%の確率で有害な応答を生成した。
テストでは、PaLM 2が一部の言語(特に英語、ドイツ語、ポルトガル語)でより明白に有害な応答をする傾向があったことが明らかになった。
一方で、PaLM 2は、オリジナルのPaLMが理解できなかった言語で創造的に書くことができ、さまざまな言語の方言とスクリプトを変換したり、複雑な数学やコーディングに対応したりする能力を持つ。
GPT-4のコメント
この記事は、Googleの新しいAIモデル、PaLM 2について述べています。PaLM 2は、人間の言語を理解し、新しい文章を生成することができます。Googleは、PaLM 2が一部のタスクでは、OpenAIのGPT-4を上回る性能を持つと主張しています。しかし、PaLM 2も完全ではなく、特定のプロンプト(AIに対する指示や質問)に対して有害な言葉を生成する可能性があるという問題があります。これは、AIが学習するデータに含まれる偏見や問題点を反映している可能性があります。AIの安全性と信頼性は、今後の開発の重要な課題となります。
Google PhotosがAIを活用した新機能「Magic Editor」を発表
ニュース要約(以下リンクから引用)
Google Photosは、ユーザーが写真を編集、強化するためにAIの使用を拡大している。新機能「Magic Editor」の導入により、より複雑な編集が可能になる。
Magic Editorでは、写真の特定の部分(前景や背景など)を編集したり、写真の隙間を埋めたり、被写体を再配置してより良いフレームを作成したりすることができる。
Magic Editorの機能を利用して、人々を背景から削除したり、被写体の肩からバッグのストラップを削除したり、被写体を別の場所に再配置したりすることができる。
Magic Editorはまた、写真の隙間をAI技術を使って埋めることも可能である。例えば、ベンチに座っている少年を写真の中心に近づけ、生成的AIを用いてベンチや風船を増やして写真を補完する。
Magic Editorは今年後半に実験的な機能としてリリースされる予定である。
GPT-4のコメント
Google Photosの新機能「Magic Editor」は、AIを活用して写真編集を強化します。これにより、写真の特定の部分を編集したり、隙間を埋めたり、被写体を再配置したりすることが可能になります。生成的AIという技術を用いて、写真の一部を新しく生成することもできます。これにより、写真をより自然で美しいものにすることが可能になります。しかし、AIが完全に正確に動作するわけではなく、時には誤動作する可能性もあります。そのため、Googleはこの新機能を「実験的な機能」としてリリースし、ユーザーからのフィードバックを基に改善を続ける予定です。
AIが歌手の声をクローン、中国のBilibiliで話題に
ニュース要約(以下リンクから引用)
中国最大のユーザー生成型ビデオストリーミングサイト、Bilibiliで、マンドポップ歌手の孫燕姿(Stefanie Sun)がバイラルになっている。
しかし、孫燕姿の音楽が再び注目を集めたのは、彼女自身の新作が出たからではなく、AIが彼女の声をクローンしたため。
技術者は、深層学習の手法である「歌声変換」を使用して、孫燕姿の声を模倣し、それをマンドポップのクラシック曲に差し替える。
中国の現行著作権法は、セレブの声を盗むAI生成曲についての具体的なガイドラインを持っていないが、中国の規制当局は合成技術全般に対する法的制約を迅速に策定している。
中国のTikTok版であるDouyinは、AIコンテンツの急増に対する法的含意に最も素早く対応し、AI生成コンテンツについてのガイドラインを発表した。
GPT-4のコメント
AIによる声のクローニングは、新たな問題として浮上しています。それは、著名人の声を無断で模倣し、音楽を作成することが著作権侵害に当たるかどうかという問題です。AIは、特定の歌手の声を精密に模倣し、新たな音楽を作成する能力を持っていますが、これはその歌手の声質や特徴を無断で使用することを意味します。この問題は現在、法的なガイドラインが明確でないため、AIと著作権法の間にグレーゾーンを生み出しています。その結果、どのような規制が必要か、またどのようにそれを実施すべきかという新たな議論が必要となっています。
AI2インキュベーターが新たに$30Mの資金を調達
ニュース要約(以下リンクから引用)
AI専門のスタートアップインキュベーター、AI2 Incubatorが新たに$30Mの資金を調達した。
このインキュベーターは、2017年以来、21の企業を育成し、その中にはAppleに約$200Mで買収されたXNORなども含まれる。
AI2は特に技術的な創業者を重視し、AI技術を活用した新たな市場を開拓する企業を育成することに力を入れている。
AI2は、AIの技術的な進歩を利用してより速く動き、より早く資金を調達することを起業家たちに勧めている。
GPT-4のコメント
AI2インキュベーターは、AIを最初から中心に置くスタートアップを育成することで知られています。これは、AI技術がビジネスの核心であり、それを活用して新たな市場を切り開くスタートアップを支援することを意味します。彼らが重視するのは、技術的な創業者で、これはそのスタートアップが独自のAIモデルを作成する可能性があるからです。このようなスタートアップは、AIの技術的な進歩を活用して競争力を持つことができ、新たな市場を開拓する可能性があります。しかし、そのためには適切な資金調達と専門知識が必要となるため、AI2インキュベーターのような支援が重要となります。
AIの活用は人間の意思決定の精度を高めるが、認知的努力を増加させる可能性も
ニュース要約(以下リンクから引用)
ESMTベルリンの新たな研究によれば、職場での機械学習の利用は常に人間の意思決定の精度を高めるが、同時に人間が意思決定を行う際の認知的努力を増やすことがあるという。
時間的な制約や多任務が課せられた状況など、認知的に制約がある専門家に対して、機械の使用は最も負荷を増やす傾向がある。
機械の入力は常に人間の意思決定の全体的な精度を向上させるが、一方で偽陽性といった特定の種類のエラーの可能性を増加させることもある。
研究者らは、機械の提供する情報が極めて正確である場合でも、人間自身の情報を評価し、機械の提案と自分自身の結論を比較するための認知的努力が必要であることを指摘している。
GPT-4のコメント
この研究は、AIと人間の協働がもたらすメリットとデメリットを浮き彫りにしています。AIの利用は、人間の意思決定の精度を向上させる一方で、一部のエラーの可能性を増加させ、認知的努力を要求するという結果が示されました。これは、AIが人間の完全な代替品ではなく、あくまで補助的な役割を果たすべきことを示しています。また、時間的制約や多任務状況など、特定の状況下でのAIの利用は慎重に検討する必要があることを示唆しています。
AIマーケティングの拡大による可能性と潜在的な課題
ニュース要約(引用)
AI(人工知能)は広告とマーケティングの未来として頻繁に取り上げられており、企業が顧客をターゲットにし、関与する方法を革新することを約束しています。
報告書によると、マーケティングにおけるAIの世界市場収益は、2023年の274億ドルから2028年の1,074億ドルに4倍増加すると予測されています。
多くの企業は既にAIを活用してマーケティング戦略を改善しています。AIの支援を受けた動的な意思決定により、マーケターはプログラマティックメディアの購入を微調整し、市場テストの勝者を特定することができます。
AIはまた、マーケティング目的で潜在的に収益のあるターゲットオーディエンスを予測・特定することも可能です。
さらに、AIはコンテンツの制作も担当しています。マーケターはAI生成のコンテンツを検索広告に限らず、メディアプレイスメントに使用しています。
GPT-3.5のコメント
AIマーケティングの拡大は、企業にとって大きな可能性をもたらします。AIの助けを借りてマーケティング戦略を最適化し、ターゲットオーディエンスを予測することで、効果的な広告や販促活動が可能となります。しかし、AIツールには潜在的な課題も存在します。バイアスや人種差別を助長する可能性があります。したがって、AIの活用にあたっては、その潜在的な課題を認識し、適切な対策を講じる必要があります。企業は、AIの利点を最大限に活かしながら、倫理的な側面にも注意を払うべきです。
SimplrがCognitive Pathsを発表し、顧客サービスの相互作用を強化する
ニュース要約(引用)
CXソリューションプラットフォームのSimplrは、新しい生成型AI技術であるCognitive Pathsのリリースを発表しました。
SimplrのCognitive Pathsは、OpenAIのChatGPTをプラットフォームに組み込むことで、顧客サービス組織が大規模言語モデル(LLMs)と生成型AIの力をフルに活用できるようにし、顧客体験とブランドの評判に関連するリスクを排除します。
このソリューションは、LLMパワードのチャットボットに利用可能な情報の総量を減らし、オフブランドのトピックへの関与の可能性を排除します。
エンタープライズグレードのセキュリティプロトコルにより、顧客データが公開されているLLMにデータが送信されないように保護されます。
GPT-3.5のコメント
SimplrのCognitive Pathsは、顧客サービスの相互作用を強化するための新たな生成型AI技術です。大規模言語モデル(LLMs)と生成型AIの力を活用しながら、顧客体験やブランドの評判に関連するリスクを排除することで、顧客サービス組織が真のパフォーマンス向上を実現できます。データの制限とエンタープライズグレードのセキュリティプロトコルにより、顧客データの安全性も確保されます。AIの進化は、顧客サービスの未来を変革する可能性を秘めており、Simplrの取り組みはその一環です。
NVIDIAとMicrosoft Azureが共同でAI開発をサポート
ニュース要約(引用)
NVIDIAとMicrosoft Azureは、開発者がAIプロジェクトや大規模な企業内統合を行う際に、NVIDIA AIプラットフォームとMicrosoft Azureクラウドの組み合わせにより、簡素化された助けを提供します。
両社は、多層のコンピューティングインフラ、カスタマイズのためのリファレンスアプリケーション、クラウドからの最適化された管理、信頼性の高いセキュリティなどを提供します。
NVIDIAとMicrosoftは、2023年5月23日から25日に開催されるMicrosoft Build開発者会議で、これらとその他のAIを可能にする技術を紹介します。
GPT-3.5のコメント
NVIDIAとMicrosoft Azureの協力により、開発者はAIソリューションの開発と展開を簡素化できます。NVIDIA AI Enterpriseは、NVIDIA AIプラットフォームのソフトウェア層であり、カスタマイズ可能な事前トレーニング済みモデルや開発ツールを提供します。また、NVIDIA Omniverse Cloudは、Azure Cloud上で利用可能なプラットフォームサービスであり、産業用メタバースアプリケーションの開発と管理を支援します。NVIDIAとMicrosoftの協力により、機械学習や生成型AIの領域での機能が向上し、新たな可能性が開かれます。
5/12(金)
ここから先は
¥ 100
この記事が気に入ったらチップで応援してみませんか?