見出し画像

【生成AIニュース】『Perplexity Deep Research』『YouTube ShortsでVeo2』『ai-gradio』『PoreFX』『OmniParser-v2.0』『RigAnything』『MuJoCo』『Ray2の実力』『中国でのドローンショー』『Unitree G1』『D-Wave Advantage 量子コンピュータシステム』

まいどです。
本日の生成AIニュース。


■Perplexity Deep Research

AI検索のPerplexityで、無料でもDeep Research機能が使えるようになりました。
読み取りには時間がかかるので、完了時に通知してくれる機能もあります。
Deep Researchの核心技術は「推論駆動型リサーチ」機構にあります。
従来の検索エンジンがキーワードマッチングを主軸とするのに対し、Deep Researchは初回検索結果の分析から不足情報を特定し、再検索クエリを自動生成する多段階プロセスを採用しています。
この技術により、単純な事実確認から複雑な分析要求まで、階層的な情報探索が可能となります。
無料プランでは1日5クエリの利用制限が設けられていますが、各クエリに対する検索深度に制限はありません。
1クエリあたり平均3分の処理時間で、最大3,000以上の情報源を横断的に分析する能力を有します。
検索範囲は学術論文データベース、政府統計、企業IR資料など信頼性の高い情報源に特化しています。
ちなみに有料プランなら1日500クエリ利用可能です。

https://www.perplexity.ai/ja/hub/blog/introducing-perplexity-deep-research

https://www.perplexity.ai/


■YouTube ShortsでVeo2

Google DeepMindが開発した最新のビデオ生成モデル「Veo 2」がYouTube Shortsに統合されました。
Dream Screen機能を使って、テキストプロンプトから新しいクリップを生成し、ストーリーテリングにシームレスに組み込むことができます。
この機能は現在、アメリカ、カナダ、オーストラリア、ニュージーランドのユーザーに対して利用可能で、将来的には他の地域にも拡大する予定です。
また、AI生成コンテンツであることを明示するため、DeepMindのSynthIDツールを使用して、AI生成されたビデオをウォーターマークやラベルで識別しています。


■ai-gradio

ai-gradio は、様々なAIプロバイダーのAPIを利用した機械学習アプリを、開発者が簡単に作成できるようにする Python パッケージです。
Gradio (グラディオ) を基盤として構築されており、複数のAIモデルやサービスに対して統一されたインターフェースを提供します。


■PoreFX

PoreFXは、3DCG制作ソフト Houdini (フーディニ) 上で動作するツールであり、デジタルキャラクターの肌を極めて写実的に描写するために開発されました。
Fareed Nagy (ファリード・ナジー) 氏によって開発され、既存のアルゴリズムを高度に活用することで、毛穴、シワ、肌の微細な凹凸といったディテールをプロシージャルに生成し、デジタルキャラクターのリアリティを飛躍的に向上させます。
生成AI技術とは異なり、PoreFXは事前に定義されたルールとアルゴリズムに基づいて肌のディテールを生成する、プロシージャル生成ツールの一例です。
しかし、その生成される肌の質感は非常にリアルで、ハイエンドなCG制作現場においても、キャラクターの表現力を高めるための重要なツールとして活用されています。
※コメントでご指摘いただき、記事内容を修正致しました。


■OmniParser-v2.0

OmniParser-v2.0 は、マイクロソフトが開発した、画面解析ツールです。
具体的には、UI (ユーザーインターフェース) のスクリーンショット画像を入力として、その内容を構造化されたデータに変換することができます。
これは、LLM (大規模言語モデル) を活用したUIエージェントの性能を向上させるために開発されました。


■RigAnything

RigAnything は、多様な3Dモデルに対して、テンプレート (ひな形) を使わずに自動でリギング (骨組み設定) を行う革新的なAI技術です。
従来のリギング手法とは異なり、自己回帰型のトランスフォーマーモデルを使用することで、高速かつ柔軟に、様々な形状の3Dモデルに骨組みを設定し、アニメーション制作を大幅に効率化します。


■MuJoCo

MuJoCo は、Multi-Joint dynamics with Contact の略で、汎用物理エンジンです。
Google DeepMind によって開発・管理されており、ロボティクス、バイオメカニクス、グラフィックスとアニメーション、機械学習など、環境と相互作用する関節構造の高速かつ正確なシミュレーションが求められる分野の研究開発を促進することを目的としています。
リリース自体は昔の物ですが、ちょくちょく更新されています。


■Ray2の実力

LumaLabsAIの新しい画像からビデオへのモデル「Ray2」ですが、非常にシームレスだそうです。
これは「Ray2」を使って、画像からビデオへの変換をした動画だそうです。
コンサートのステージを広角で撮影し、ギタリストのパフォーマンスを強調するようなショット構成やカメラワークの詳細を含んでいます。


■Qiskit 2.0の誤り耐性実装

IBMが発表した量子開発フレームワーク「Qiskit 2.0」は、表面符号に基づくフォールトトレラント設計を採用しました。
論理量子ビット誤り率を10^-9に低減し、128量子ビットシステムでの化学反応シミュレーションを従来比1,000倍高速化したそうです。


■中国でのドローンショー

これは綺麗で凄いですね。
ただ、動画は早送りのようです。


■Unitree G1

アップグレードされたアルゴリズムにより、G1 はあらゆるダンスを学習するそうです。
中々軽快にダンスしてますw


■D-Wave Advantage 量子コンピュータシステム

量子コンピュータシステム、ソフトウェア、サービスのリーディングカンパニーである D-Wave Quantum Inc. は、研究機関、学術機関、政府機関向けにオンプレミス型 D-Wave Advantage 量子コンピュータシステムの販売を開始することを発表しました。
5,000キュービット以上、15方向接続の世界最大のアニーリング型量子コンピュータ D-Wave Advantage を、顧客が自社施設に導入・所有できるようになります。
価格は顧客の個別要件に合わせて調整され、システムの輸送、設置、校正、継続的なメンテナンス、およびローカルハイブリッド量子ソルバーの設定支援が含まれます。


本日は以上となります。

SeaArtAI

それでは、また。

いいなと思ったら応援しよう!

この記事が参加している募集