見出し画像

Weekly Report 2024/05/29 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0137

V8!V8!V8!V8!Witness me!


[御礼] 自由が丘 春のマリクレール祭り2024


[お知らせ] Nintendo Switch "ペーパーマリオRPG" 発売

ブラックユーモア満載で、紙ならではの面白いギミックなど、とても楽しい作品になっているので良かったら是非プレイしてみて下さいませ~!


[V8] マッドマックス:フュリオサ 5月31日(金) 劇場公開

遂に公開します。前作、怒りのデスロードは、劇場で12回見るぐらいハマってしまったので、今作はどうなるのか逆に怖いです。今の所、6/1の朝に池袋グランドシネマサンシャインのIMAXで1回目を観る予定です。V8


[ニュース] AI関連

[AI活用] THE ODD BIRDS AI PROJECT

素晴らしすぎるAI活用事例です。自分の作品を追加学習したモデル活用し、Adobe Character Animatorでリグを組んでアニメーションをしています。LoRA学習やクレイアニメーションの質感、表現など、AIの得意不得意を理解した上で自分の作風にAIを取り入れています。ヤン・シュヴァンクマイエル、JUNKHEAD、MADGOD、LAIKA作品などのアニメーション作品が昔から大好きなので、そのアプローチもいずれ模索したいと思います。


[動画] I2VEdit: First-Frame-Guided Video Editing via Image-to-Video Diffusion Models

動画内の1フレームを編集する事で、動画全体に反映するフレームワークです。これは使い勝手が良さそうですね。

[3D] CSM - Update text to animation

3D系AIサービスの中でCSMは強すぎますね。もうどこまで行くのか楽しみです。


[動画] Tencent - ReVideo

動画内の一部分をモーションとプロンプトを使用し、編集可能にするフレームワークです。トラッキングしたモーションを活用する事でかなり安定した編集が出来てますね。使ってみたいです。


[画像] Meta - Instance Diffusion

ポイントやボックスで選択した個所をピンポイントでコントロールするフレームワークです。こちらはComfyUIでも実装されているので興味がありましたら是非。


[Dataset] alfredplpl - commoncatalog cc by ext

先週紹介したCommonCanvasのデータセットに対して更にphi3を活用し日本語のキャプションをつけたデータセットになります。自分も似たようなことをしようとしていたのでかなりありがたいですね。自分の過去の写真や素材など1000万枚ほど集めたので、自分もphi3にキャプション入れてもらうと思います。


[LLM] Stability.ai - Stable Assistant

このアプローチは興味深いですね。ChatGPTに近いワークフローになりますが、画像だけでなく動画やアップスケールなど、クリエイティブ系に特化したChatBotは今まで見たことが無いのでどういう活用になるのか楽しみです。


[動画] CameraCtrl - Gradio Demo リリース

AnimateDiffを開発したチームが、SVD-xtベースのCameraCtrlのdemoが公開されました。興味がありましたら触ってみて下さい。ComfyUIで実装されたものも見つけましたのでそちらも共有させていただきます。


[3D] ComfyUI-3D-Pack - Update

かなり使いたいんですが、うまく実装が出来ないですね・・・。頑張ります。


[動画] Krea- Krea Video Open Beta

Krea Videoのオープンベータがアナウンスされましたね。こういったモーフィング表現はAIならではの表現だと思っています。このサービスと同じワークフローはIP AdapterとAnimateDiffを活用しComfyUIで再現しているのでご興味がありましたらご連絡ください。


[動画] LeiaPix > immersity AI

AIサービスの中では古参のLeiaPixがImmersityAIに変わりました。3D系の動画表現を突き詰めている感じですね。


[GPU] nVidia - RTX 5090 リーク情報

32GBはありがたすぎます・・・。SDXLの学習モデルを作るのにVRAMと時間がかなりかかるので、もし本当にこのスペックで45万円以内でしたら即購入したいと思います。Embergenのリアルタイム流体シミュレーションでも活用したいです。


[記事] Microsoftが医療特化のAIモデル発表、マルチモーダルをがん診断に応用へ

医療系にもマルチモーダルモデルが活用され始めましたね。ブラックジャックの"U-18"が出来るのも時間の問題な気がしてきました。


[記事] マイクロソフト、自律型AIソフトウェアエンジニア「Devin」のCognition AIと提携を発表。Azure上でDevinを提供へ

自立型はいよいよ感ありますね。Horizon Zero Dawnの様な世界にならないことを祈ります。


[AI活用] AI rendering workflow

アニマティクスやプリビズから様々なパターンでルックデブしてもらうワークフローも組んでみたいですね。最近はライティングもコントロールできるようになったので、色々試してみようと思います。


[画像認識] YOLOv10: Real-Time End-to-End Object Detection

最近は画像認識の需要が高まってきたので、yolov10はありがたいです。どのぐらい精度が変わったか検証してみようと思います。


[音楽] Suno - song from any sound

Sunoもそろそろ触らないとですね。是非聞いてみて下さい。


[声] “声の権利”問題、人気声優・梶裕貴は「共存すべき」AI活用した音声合成ソフト発売 20周年に製品化決意

AIに対しての梶さんのスタンスも含めて素晴らしいプロジェクトですね。


[法律] AI時代の知的財産権検討会 -中間とりまとめ


[法律] AI、知財の学習なら原則規制せず 創作物は「人の発明」

"知財権についてAIに学習させる段階では原則、権利侵害は発生しないと整理した。"


[記事] モデルが衣服を“着用”している画像をAIで生成、グーグルの新しい広告ツールが目指していること

ユーザーに合わせた広告が生成される世界にもなりそうですね。


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[講演] 『ゼルダの伝説 テアーズ オブ ザ キングダム』 GDC 2024


[カンファレンス] CEDEC2025に関するご案内


いいなと思ったら応援しよう!