
Weekly Report 2024/10/02 (wed)
個人的に気になったニュースや自主制作などの週報メモです。
自主制作 / 記事
Elemental Anima #0155
Elemental Anima #0155
— takio koizumi | takion.eth (@takion0105) September 28, 2024
Created by :
takio koizumi (Human) x HAL (AI)
🔽Detail / Link pic.twitter.com/qCCz49P5zs
先日、江の島観光で行った江島神社や江の島岩屋からインスピレーションを受けて制作しました。ちょうど去年”Elemental Anima #0103"でウミガメをモチーフにした繋がりもあります。江島神社の奥津宮にあった"八方睨みの亀"がとても印象に残ったのもありモチーフに採用しました。全体の構図は、江島神社の社紋をベースにしています。江ノ島全体の地形、高低差、寺、灯台、洞窟、更に至る所にゼルダのトライフォースの様な社紋がありオープンワールドゲームのマップの様な感じでとても興味深かったです。データセットを沢山集める事ができ、文化や歴史も学習できるので旅行は良いですね。HAL(AI)に旅行の想い出を学習してもらい作品を制作するのは楽しいです。
作業BGM:Nintendo『ゼルダの伝説 ブレス オブ ザ ワイルド オリジナルサウンドトラック』
[データセット] 江島神社 / 江の島岩屋
【データセット】
— takio koizumi | takion.eth (@takion0105) September 28, 2024
江島神社 / 江の島岩屋 pic.twitter.com/vvvy0ZitDm
[お知らせ] AIファッションイベント『NFFT2025_SS AI Fashion Movie 展』
☯お知らせ☯
— takio koizumi | takion.eth (@takion0105) October 2, 2024
AIファッションイベント『NFFT2025_SS AI Fashion Movie 展』に参加します!
場所:渋谷PARCO 4階 特設スペース
日程:10/18(金)~10/20(日)
URL:https://t.co/q6ymBa6W6g
プレスリリース:https://t.co/azqrcD874B
ご興味がありましたら是非お越しくださいませ!#NFFT2025
ご興味がありましたら是非!
[ニュース] AI関連
[ComfyUI] 東京ComfyUI 交流イベント 簡易レポート
Tokyo ComfyUI Meet Up / 東京ComfyUI 交流イベント pic.twitter.com/v8c3B0nowI
— takio koizumi | takion.eth (@takion0105) September 27, 2024
ComfyUIの交流イベントに行ってきました。周りでComfyUIについて話せる仲間が少なかったので、ワークフローの組み方など様々な議論が出来て最高に楽しかったです。開発者の方とは、同じノードベースのHoudiniの機能を紹介しました。隣の席の方がCivitAIに所属し"Open Model Initiative"のモデル制作リーダーをされている方でした。自分が今一番期待しているプロジェクトに関わる方だったので"データセットの重要性"や"オープンソース文化・歴史"、"今後の展望や裏話"などかなり熱いディスカッションが出来ました。次回がありましたらまた参加したいと思います。ComfyUI最高!
[動画] PIKA - PIKA 1.5
Sry, we forgot our password.
— Pika (@pika_labs) October 1, 2024
PIKA 1.5 IS HERE.
With more realistic movement, big screen shots, and mind-blowing Pikaffects that break the laws of physics, there’s more to love about Pika than ever before.
Try it. pic.twitter.com/lOEVZIRygx
ここにきて動画生成サービスPIKAが1.5にバージョンアップして、かなり面白い表現になりました。特に後半のMelt、Expolotionなどはクオリティも高く、性癖も強めなのでPikaを触ってみたいと思いました。性癖での戦い方は良いですし、PVの作り方もうまいですね。動画生成サービスの勢力図が少し変わりそうです。
[動画] Kling AI - Lip Sync etc.
For more details, dive into our video! 🎥 https://t.co/JXMtyxIcMi pic.twitter.com/LPtgDsp6Ez
— Kling AI (@Kling_ai) October 1, 2024
リップシンク機能が追加されてAPIもウェイトリストなしで使えるようになりました。モーションブラシも対応していますし、今の所一番使い勝手がいいですね。
[動画] Luma AI - Dream Machine v1.6 Hyper fast video generation
🚀 Welcome to the era of Hyperfast video generation: with 10x faster inference, you can now generate full-quality Dream Machine v1.6 clips in under 20 seconds. No "turbo" or "distilled" models - just uncompromised quality. Available today to all subscribers and API customers. pic.twitter.com/9mc5vJrTf0
— Luma AI (@LumaLabsAI) September 30, 2024
生成速度が上がりました。結構時間がかかってたので、シンプルにありがたいアップデートですね。文面が完全にRunwayに対抗してる感じが"敵対的(GAN)"で素晴らしいですね。そろそろ動画系もCogX含めて"拡散(Diffusion)"の時期にはいって欲しいです。
[動画] Runway - 3D animations with Gen-3 Alpha
Combine simple 3D animations with Gen-3 Alpha Video to Video to achieve specific styles and visions without having to texture or light your scenes. pic.twitter.com/ppjzWQRiqT
— Runway (@runwayml) September 30, 2024
今週は大きなアップデートはありませんでしたが、シンプルで良い活用例ですね。
[LLM] OpenAI - DevDay
That’s a wrap for DevDay SF! We can’t wait to see what you build with these new capabilities. London and Singapore, see you soon. 🇬🇧🇸🇬https://t.co/VI8UNJPbmH
— OpenAI Developers (@OpenAIDevs) October 1, 2024
個人的には画像を用いたファインチューニング機能が気になりますね。クオリティチェックとプロンプト生成の仕組みを考えているので、こちらの情報は追ってみたいと思います。
モデル蒸留とAdvanced VoiceでHAL(AI)と会話できるようにしていきたいですね。
[企業] Meta Connect 2024
凄い情報量でしたね。Meta AIやLlama 3.2も嬉しいですが、Ray-Ban Meta smart glassesが一番気になりました。重さなども含めて一回試してみたいです。電脳コイルの世界にまた一歩近づいた感じでワクワクします。
[LLM] Dify.AI - Dify v0.9.0
🔥 Dify v0.9.0がリリースされました!
— Dify.AI Japan (@DifyJapan) September 30, 2024
内部および外部のナレッジベースをアップグレードし、より多くのオプションと高い精度を提供します。
📚 外部ナレッジベース… https://t.co/D7hYYpRAm6
Difyでチャットツールなどを制作する機会が増えたので、アップデートが重要になってきました。バグが無くなってるといいなぁ。
[画像] Flux.1 Dev - ControlNet Outpainting
Fluxのアウトペインティングワークフローも組もうと思っていたので、助かります。
[画像] Magnific ai - Mystic v2
🔥 Mystic v2 is out! 🔥
— Magnific.ai (@Magnific_AI) September 26, 2024
Magnific is no longer just an upscaler, it’s now one of the top AI image generators out there, creating images up to 4K quality.
This isn’t just an update; it’s a fresh start for us. pic.twitter.com/pNX7J1jKmz
Magnific aiはとんでもないレベルまできてますね。ローカル環境でここまで再現したい・・・。Fluxのアップスケーラーも出てきているので色々チャレンジしてみようと思います。
[3DGS] DaVinci Resolve - Irrealix Brings Gaussian Splatting
自分もたまに活用するIrrealix Brings Gaussian SplattingがAEだけではなく、DaVinci Resolveにも対応しました。
[3DGS] Chaos V-Ray 7 to support Gaussian Splatting
遂にV-Rayで3DGSをサポートし始めてきましたね。CG制作のワークフローが変わってくる感じがしてます。
[LLM] Ai2 - Molmo
GPT-4oやGoogleのGemini 1.5 Pro並みの性能を持ちつつ、サイズが小さいマルチモーダルモデル。ComfyUIにLLMを組み込む必要が出てきて、ちょうど今のニーズにピッタリなモデルなので嬉しいです。
[ComfyUI] ComfyUI - Molmo
そして、一瞬でMolmoに対応したComfyUIのカスタムノードが出ていたので、これは即試したいと思います。プロンプト自動生成+Flux+クオリティチェックワークフローをこれで一旦構築します。
[3D] Meta - Flex3D
Metaさん、こちらもあわよくばオープンソースにしていただけれると大変ありがたいです。
[音楽] Udio Lyric Editor
Introducing the Udio Lyric Editor, now available for all users.
— udio (@udiomusic) September 26, 2024
⚡️ Generate random or prompt-based lyrics
🪡 Weave in your own style by adding lines
🖊️ Make content edits to fine tune
✨ Bonus features ✨
Highlight a line to get AI help with editing
Type '/' as a shortcut to… pic.twitter.com/YiOQQcT1rY
プロンプトから生成した歌詞に対して追加・編集など調整し楽曲を生成可能になりました。
[ComfyUI] cg-controller
赤いノードを一つのフローティングパネルに集約するカスタムノードです。最近出来るだけ簡素に使い易いワークフローの構築が求められるので、このアイデアは面白いですね。試してみようと思います。
[LLM] AMD - AMD-Llama-135m
AMDがかなり小さいLLMを公開しました。NPUもありますし、遂にAIモデル制作にも乗り出しましたね。Intelは出してたりしないんでしょうか?
[動画] Tencent - LVCD コード公開
先週紹介した線画の自動着彩フレームワークのコードが公開されました。
[記事] NVIDIA GeForce RTX 5090のスペックがリーク。CUDAコア21760と32GBのGDDR7搭載でTDPが600Wのモンスタースペックに
リーク情報にはなりますが、Fluxの影響でVRAMの消費もかなり上がったので、本当だったら嬉しいですね!消費電力はもう少し下がって欲しいですが、発売されたらすぐ購入したいです。
[記事] AI開発規制法案 カリフォルニア州知事が署名拒否で成立せず
かなり注目していた法案でしたが成立しなかったんですね。
[政府] 公正取引委員会 - 「生成AIを巡る競争」に関する情報・意見の募集について
しっかりと意見を送りたいと思います。
[記事] さくらネット、NVIDIA製GPUを追加調達 68億円で800個
日本で一番GPUを持ってるんじゃないでしょうか。
[ニュース] CG・ゲーム・リアルタイムエンジン関連
[Epic] Unreal Fest Seattle 2024 | Opening Session
Unreal Engine 5.5 Preview 1
[Epic] Unreal Fest Seattle 2024 | Unreal Engine 5.5 Preview 1
We are Mega excited about this in particular 🔦
— Unreal Engine (@UnrealEngine) October 1, 2024
MegaLights, a new experiential feature in 5.5, enables artists to use orders of magnitude more lights. They are movable and dynamic, with realistic area shadows, and can light volumetric fog. See this capture of our live, real-time… pic.twitter.com/H3SL04CRH8