今日気になったAI系のニュース【23/4/25】

※より正確な情報は引用元のリンクをご覧ください。
※「GPT-4で要約→手動で修正→たまにコメントいれる」で説明を書いてます。

ビル・ゲイツ:AIが18ヶ月以内に子供にリテラシーを教えるようになる

  • Microsoft共同創設者Bill Gatesによれば、AIチャットボットが今後18ヶ月以内に子供たちの読み書きスキル向上に利用される可能性がある

  • AIは人間と同等のチューターになる能力を持つと語った

  • OpenAIのChatGPTGoogleのBardなどのAIチャットボットが急速に進化し、一部の標準化テストで人間レベルの知性と競合するようになった

  • 従来、コンピューターにとって文章力向上の指導は困難であったが、AIチャットボットは人間の言語を認識し再現する能力がある

  • New York TimesのテックコラムニストKevin Rooseは既にChatGPTを使って自身の文章を向上させている

  • チャットボットが要約やフィードバック提供、エッセイ執筆で印象的な成果を出している

  • チャットボットが実用的なチューターになるには技術の向上が必要で、より人間の言語を理解し再現する能力が求められる

  • チャットボットが数学よりも読み書きで優れることに驚くかもしれないが、数学はAI技術開発に使われることが多く、チャットボットには数学的計算が苦手である

  • Gates氏は、今後2年以内に技術が向上し、幅広い層の生徒たちにプライベート指導を提供できるようになると確信している

  • 無料版のチャットボットも存在するが、より高度なバージョンは有料で提供されるだろうが、人間のインストラクターよりも手頃でアクセスしやすいと考えている


手間をかけずに画像を動かす:Text2Video-Zeroは、テキストから画像に変換するAIモデルで、ゼロショット動画ジェネレーターになります。

  • 生成AIモデルが急速に進化し、低解像度の顔画像から高解像度のフォトリアリスティックな画像を生成できるようになった

  • Text2Video-Zeroは、ゼロショットのテキストからビデオを生成するモデルで、カスタマイズにトレーニングが不要

  • 既存のテキストから画像モデルを利用し、連続する画像を動画として生成する

  • 時間的整合性を確保するため、2つの軽量な修正が行われる

    1. 潜在ベクトルに動きの情報を追加して、一貫性のあるシーンと背景を維持

    2. セルフアテンション層をクロスフレームアテンションに置き換え、各フレームのアテンションを最初のフレームに集中させることで、前景オブジェクトのコンテキスト、外観、アイデンティティを保持

  • 大規模なビデオデータのトレーニングが不要で、高品質で時間的に整合性のあるビデオ生成が可能

  • テキストからビデオ合成に限定されず、条件付きや専門的なビデオ生成、テキスト命令によるビデオ編集にも適用可能

  • ☆githubのコードはこちら。GitHub - Picsart-AI-Research/Text2Video-Zero: Text-to-Image Diffusion Models are Zero-Shot Video Generators 



Neural Radiance Fields Transformed:このAIアプローチは、NeRFから正確な3Dメッシュを抽出することができます。

  • 3Dシーンとオブジェクトの再構築は、ロボティクス、フォトグラメトリ、AR/VRなどの分野で重要

  • NeRFは、3Dシーン再構築のデファクトスタンダードで、空間内の各位置で放射を放出できる3D表現を利用

  • NeRFの最適化は、新規ビューシンセシス(NVS)タスクに焦点を当てており、放射場から正確な3Dメッシュを取得できない

  • NeRFMeshingは、NeRFベースのネットワークから幾何学的に正確なメッシュを効率的に抽出するために設計された

  • NeRFMeshingは、署名付き表面近似ネットワーク(SSAN)という新しい構造を導入し、NeRFレンダリングの表面と外観を決定する

  • NeRFMeshingは、どのNeRFとも互換性があり、高速な3Dメッシュ生成が可能で、複雑な表面もモデル化できる

  • NeRFから正確な3Dメッシュを抽出し、AR/VR、ロボティクス、フォトグラメトリなどの分野で利用できる


Snapchat、「My AI」機能をパンクさせたユーザーによる1つ星レビューが急増、削除を求める声も

  • Snapchatは、Snap Inc.によって開発されたアメリカのインスタントメッセージングアプリとサービスである。Snapchatの主な特徴の1つは、写真やメッセージは通常、受信者がアクセスできなくなるまでの短い時間しか利用できないことです。

  • Snapchatの「My AI」機能が悪評を受ける

  • OpenAIのGPT技術を利用したAIチャットボットが導入され、ユーザーが質問してすぐに回答を得られる

  • 米国App StoreでのSnapchatの評価が、1.67の平均で75%が1つ星

  • アプリ内でAIがユーザーの位置情報を知っていることに驚いている人も多く、不気味だと感じる

  • 一部のユーザーは、AIを削除してほしいと言ってSnapchatのアプリを削除すると脅している

  • Snapchatは、ユーザーがAI機能を好まない場合は使わなくてもいいと述べている


Volvo Cars Tech Fund、ドライバー・モニタリングのスタートアップ企業CorrActionsに投資

  • イスラエルのスタートアップCorrActionsが、運転者の認知状態を理解できるドライバーモニタリングシステムを開発

  • Volvo Cars Tech Fundから戦略的投資を受けることを発表、今回のラウンドの目標は600万ドル

  • CorrActionsのアイデアは、既存の車に組み込まれたセンサーを利用し、運転者の筋肉の微細な動きを監視すること

  • これらの動きは、運転者が疲れている、気が散っている、または酔っているかどうかをチェックするために、CorrActionsのアルゴリズムが評価できる脳活動を反映する

  • 現在、同社は、ステアリングホイールのセンサーや圧力ベースのシートセンサー、および運行管理者が運転者と連絡するために使用するアプリのモーションデータを中心に活動している

  • Volvo Cars Tech Fundは、CorrActionsの技術をさらに開発・商業化するために出資することを発表


Apigee、AIを活用したAPI保護機能の新機能を公開

  • RSAサイバーセキュリティ会議に合わせて、Google CloudがApigeeを更新し、ビジネスロジック攻撃を防ぐためのAPI管理と予測分析サービスを強化

  • ビジネスロジック攻撃とは、アプリの設計や実装の欠陥で、悪意のある行為者が意図しない動作を引き起こすもの

  • Googleは、Apigeeに新しい機械学習モデルを導入し、ビジネスロジック攻撃を検出することを目的としている

  • これらのモデルは、Apigee Advanced API Securityのすべての顧客に利用可能で、Googleの内部データで訓練されている

  • 新しいダッシュボードも導入され、APIの乱用をより正確に特定し、攻撃のパターンを見つけ出す

  • APIセキュリティへの懸念が企業で増加しており、2022年末にはAPI攻撃が大幅に増加

  • APIの不安全性は、企業に年間410億〜750億ドルのコストがかかることが判明


GitLabの新セキュリティ機能、AIで開発者に脆弱性を説明する。

  • 開発者プラットフォームGitLabが、AI駆動のセキュリティ機能を発表し、大規模言語モデルを使って開発者に潜在的な脆弱性を説明

  • 今後、AIを使用してこれらの脆弱性を自動的に解決する機能の拡大を計画

  • 新機能「この脆弱性を説明」は、コードベースのコンテキスト内で脆弱性を修正する最善の方法を見つける手助けをしようと試みる

  • GitLabは、AI機能を追加する背後にある全体的な哲学を「ガードレール付きの速さ」と呼ぶ

  • GitLabは、すべてのAI機能がプライバシーを考慮して構築されていることを強調

  • GitLabのAIイニシアチブの全体的な目標は、効率を10倍にすることであり、全体的な開発ライフサイクルの効率を向上させることを目指す

  • 近年のGitLabのDevSecOpsレポートによれば、65%の開発者がテストにAIとMLを使用するか、今後3年以内に使用する予定

  • 既に36%のチームが、コードレビュアーが確認する前にAI/MLツールを使ってコードをチェックしている


AIアプリ「Petey」がChatGPTを使ってApple Musicのプレイリストを作成

  • Peteyは、Apple Watchユーザー向けにChatGPTを紹介したモバイルアプリで、最近iPhoneでも利用可能に

  • Peteyの最新アップデートで、Apple Musicに接続し、プレイリストを作成したり、曲をApple Musicライブラリに追加できる

  • 有料の「Petey Premium」サブスクリプションで、最新のAIモデルGPT-4にアクセス可能

  • プレイリストのリクエストをアプリのインターフェースに入力するだけで、Peteyが音楽の推薦を提供

  • Apple Musicライブラリに個別の曲を保存するだけでなく、プレイリストも作成できる

  • これらの機能を利用するには、Apple Musicのサブスクリプションと、PeteyのBasicまたはPremiumサブスクリプションが必要

  • Apple Musicの統合、GPT-4のサポートに加えて、今日ロールアウトされる他のアップデートには、Petey Basicサブスクリプションの他の支払いオプション、代替アプリアイコン、基本サブスクリプションや独自のAPIキーがなくてもApple Watchから電話にメッセージを送信できる機能が含まれる

  • PeteyはApp Storeから無料でダウンロードできるが、iPhoneでの機能利用にはサブスクリプションが必要


グーグルがサイバーセキュリティにジェネレーティブAIを導入

  • サイバーセキュリティのための生成AIが新しいトレンドとして出現

  • GoogleがRSA Conference 2023で、Cloud Security AI Workbenchを発表

  • これは、Sec-PaLMと呼ばれる特化した「セキュリティ」AI言語モデルを搭載したサイバーセキュリティスイート

  • Sec-PaLMは、ソフトウェアの脆弱性、マルウェア、脅威インジケータ、行動脅威アクタープロファイルなどのセキュリティインテリジェンスを取り込む

  • Cloud Security AI Workbenchには、新しいAI駆動のツールが含まれ、MandiantのThreat Intelligence AIなどがSec-PaLMを利用して、セキュリティ脅威を見つけ、要約し、対処

  • VirusTotalもSec-PaLMを使用して、悪意のあるスクリプトの分析と説明を支援

  • しかし、生成AIがサイバーセキュリティにどれだけ効果的かはまだ不明で、研究が不足している

  • GoogleやMicrosoftの主張には、慎重な態度が必要


"GPT "はOpenAIの思い通りになれば、すぐに商標登録されるかもしれない

  • OpenAIが、自社ブランドを保護しようとしている

  • ThreatGPT、MedicalGPT、DateGPT、DirtyGPTなどが、米国特許商標局(USPTO)に商標登録を申請

  • OpenAIは、「GPT」(Generative Pre-trained Transformer)の商標登録を申請し、USPTOに審査を早めるよう嘆願

  • しかし、先週、OpenAIの嘆願は却下

  • OpenAIが結果を得るまでに、最大で5か月かかる可能性がある

  • OpenAIは、商標登録を確保できる可能性が高いが、結果は確実ではない

  • USPTOがOpenAIの申請に問題がないと判断しても、他の市場参加者が「GPT」商標を否定する理由を主張できる反対期間がある

  • OpenAIは、長引くプロセスの中で、「GPT」が有名な商標であると確立できれば、より広い範囲でその使用を防ぐことができる

  • (これだけなんとかGPT乱立してるのに、GPT使えなくなったらみんなだるいだろうね)


Nvidia、テキスト生成AIを「より安全に」するツールキットを公開

  • テキスト生成AIモデル(例:OpenAIのGPT-4)は、多くの誤りや有害な内容を含むことがある

  • これらのモデルの開発企業は、フィルターや人間のモデレーターを導入することで問題を修正しようとしているが、完璧な解決策はない

  • より「安全」なテキスト生成モデルを目指して、NvidiaがNeMo Guardrailsをリリース

  • NeMo Guardrailsは、テキスト生成や音声生成のAIアプリを「正確、適切、関連性があり、安全」にするためのオープンソースツールキット

  • しかし、言語モデルの問題を全て解決するユニバーサルな修正方法は現実的ではなく、Guardrailsも完璧ではない

  • Nvidiaは、Guardrailsが「十分に指示に従う」モデルやLangChainフレームワークを使用するAIアプリに最適だと指摘

  • また、NvidiaはGuardrailsを自社のNeMoフレームワークの一部としてリリースしており、企業向けAIソフトウェアスイートやNeMoクラウドサービスで利用可能

  • Guardrailsは銀の弾丸ではなく、Nvidiaがそう主張することに注意する必要がある


Stability AI、ChatGPTに代わるオープンソースの「StableLM」を提供開始

  • 水曜日に、Stability AIがStableLMというオープンソースAI言語モデルの新シリーズをリリース

  • このモデルは、2022年にリリースされたStable Diffusionオープンソース画像合成モデルの効果を再現することを目指しており、磨きがかかればChatGPTのオープンソース代替品として使用できる可能性がある

  • StableLMは、GitHubでアルファ版が利用可能であり、3億および70億のパラメーターモデルが提供され、後に150億および650億のパラメーターモデルが追加される予定

  • Stability AIは、オープンソースの競合相手としてOpenAIと対立するロンドンを拠点とする企業である

  • StableLMは、GPT-4のような大規模言語モデル(LLM)と同様に、文章の次のトークン(単語の断片)を予測することによりテキストを生成する

  • MetaのLLaMA、Stanford Alpaca、Cerebras-GPT、Dolly 2.0などの最近の「小型」LLMと同様に、StableLMは、OpenAIのベンチマークGPT-3モデルと同等の性能を遥かに少ないパラメーターで達成すると主張している

  • パラメーターが少ないことは、言語モデルが小型で効率的になり、スマートフォンやラップトップなどのローカルデバイスで実行しやすくなるが、高性能を維持するためには慎重な設計が必要であり、これはAI分野での大きな課題である

  • Stability AIによると、StableLMは、「The Pile」というオープンソースデータセットをベースにした新しい実験データセットでトレーニングされており、その大きさは3倍である

  • 7BパラメーターのStableLMモデルは、Hugging FaceとReplicateでテストが可能であり、また、Hugging Faceは、ChatGPTと同様の会話形式を持つStableLMのダイアログチューニングバージョンを提供している

  • Stabilityは、「近い将来」にStableLMに関する完全な技術報告書をリリースすると述べている

いいなと思ったら応援しよう!