マガジンのカバー画像

3DCG / Motion

26
運営しているクリエイター

#AI

【論文瞬読】スケッチから3Dゲームの世界が生まれる!? AI技術が変える次世代のゲーム開発

【論文瞬読】スケッチから3Dゲームの世界が生まれる!? AI技術が変える次世代のゲーム開発

こんにちは!株式会社AI Nestです。今回は、ゲーム開発の世界に革命を起こしそうな最新のAI技術について紹介します。手書きのスケッチから、リアルな3Dゲームの世界を自動生成する――そんなSF映画のような技術が、現実のものになりつつあるんです!

はじめに:Sketch2Sceneとは?最近、「Sketch2Scene: Automatic Generation of Interactive 3D

もっとみる
画像を3Dに変換するAIツール「Stable Fast 3D」を試してみる

画像を3Dに変換するAIツール「Stable Fast 3D」を試してみる

Stable Fast 3DとはStable Fast 3D…一瞬で画像を3D化するということでちょっと話題になってたので調べてみましたが、1 枚の画像から高速かつ高品質のテクスチャ付きオブジェクト メッシュを再構築する新しい手法で、内容としてはStability AIでTripoSR をベースにしているものとのこと。
作者はMark Bossさん。偉大な発明をありがとう!
速さと質が売りのような

もっとみる
UbuntuでMusePoseを試してみる

UbuntuでMusePoseを試してみる

「仮想人間生成のためのポーズ駆動型イメージ-to-ビデオ フレームワーク」であるらしいMusePoseを試してみます。

1. 準備環境構築

python3 -m venv museposecd $_source bin/activate

リポジトリをクローンして、パッケージをインストールします。

# clonegit clone https://github.com/TMElyralab/

もっとみる
新しく見つけた2D-to-3Dの「CraftsMan」を試してみる

新しく見つけた2D-to-3Dの「CraftsMan」を試してみる

ということで今回はまた新しく見つけた2D-to3DのCraftsManを触ってみたいと思います!

CraftsManの最大の特徴は、二段階プロセスで行う高速かつ高精度な3Dメッシュ生成で、多様なMVモデルが選べるところらしいです。

CraftsManとはざっくりですがこのCraftsManのことをまとめて言うと、二段階のテキスト/画像から3Dメッシュを生成するモデルのことです。
特徴と呼ばれる

もっとみる
3Dポイントクラウドデータの理解を目指した大規模言語モデル PointLLM

3Dポイントクラウドデータの理解を目指した大規模言語モデル PointLLM

PointLLMはオブジェクトのカラーポイントクラウドを理解することができるマルチモーダル大規模言語モデルです。このモデルは、あいまいな深度、遮蔽、視点依存性の心配なく、オブジェクトの種類、幾何学的構造、および外観を認識します。2段階のトレーニング戦略を可能にするために、66万件のシンプルなポイント・テキスト指示ペアと7万件の複雑なポイント・テキスト指示ペアからなる新しいデータセットを収集しました

もっとみる
MotionGPT で作ったモーションを任意の 3D モデルに割り当てて動かす

MotionGPT で作ったモーションを任意の 3D モデルに割り当てて動かす

MotionGPT でモーションを生成し、Blender 上で 3D モデルに適用して動かしてみた。

モーション生成概要

テキストからモーションを生成する技術。
行動を表すテキストを再現するようなモーションが得られる。

様々な手法

Motion Diffusion Model や text-to-motion 等様々な手法があり、Awesome-Video-Diffusion リポジトリに

もっとみる
WSL2でTripoSRを試してみる

WSL2でTripoSRを試してみる

「Tripo AI と提携し、LRM: Large Reconstruction Model For Single Image to 3D にインスパイアされた高速3Dオブジェクト再構築モデル」であるTripoSRを試してみます。

使用するPCはドスパラさんの「GALLERIA UL9C-R49」。スペックは
・CPU: Intel® Core™ i9-13900HX Processor
・Me

もっとみる
3D画像を高速生成できるTripoSRというオープンソースのGoogle Colabでの実行方法

3D画像を高速生成できるTripoSRというオープンソースのGoogle Colabでの実行方法

今回は、Google Colab上で、2D画像から3D画像を高速に生成できるTripoSRというオープンソースモデルを試してみます。

開発は、Tripo AIとStability AIとなります。

今回は、上記コードを参考に修正し、Google Colab V100で実行します。

左側に3D画像にしたい2D画像を取り込んで、Generateをクリックすると、右側に3D画像ができます。実際に、

もっとみる
Google Colab で Moore-AnimateAnyone を試す

Google Colab で Moore-AnimateAnyone を試す

「Google Colab」で「Moore-AnimateAnyone」を試したので、まとめました。

1. Moore-AnimateAnyone「Moore-AnimateAnyone」は、「AnimateAnyone」の再現実装です。元の論文で実証された結果を一致させるために、さまざまなアプローチやトリックを採用していますが、それらは論文や別の実装とは多少異なる場合があります。

これは非常

もっとみる
TDPTでポーズ取得してBlenderで調整してChatVRMで再生する

TDPTでポーズ取得してBlenderで調整してChatVRMで再生する

「TDPT」でポーズ取得して「Blender」で調整して「ChatVRM」で再生する手順をまとめました。

1. TDPT「TDPT」(Three D Pose Tracker) は、誰でも簡単にWebカメラ (またはiPhoneカメラ) のみでフルボディトラッキングできるツールです。今回はiOS版を使います。

ダウンロード無料、一部買い切り課金で利用できる「プレミアムメニュー」(600円) が

もっとみる
Google Colab で MoMask を試す

Google Colab で MoMask を試す

「Google Colab」で「MoMask」を試したので、まとめました。

1. MoMask「MoMask」は、テキストからモーションを生成する手法です。生成したモーションは、「BVHファイル」でダウンロードすることができます。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1) 公式リポジトリで紹介されているColabノートブックを開き、Colabのメニュー「ファ

もっとみる