Weekly Report 2024/08/07 (wed)

2024年8月7日 21:24

個人的に気になったニュースや自主制作などの週報メモです。

自主制作 / 記事

Elemental Anima #0147

Elemental Anima #0147

Created by :
takio koizumi (Human) x HAL (AI)

🔽Detail / Link pic.twitter.com/W7kM3YPedH
— takio koizumi | takion.eth (@takion0105) August 3, 2024

前作はタコだったので、今作はホタルイカをモチーフにしました。右の泡から星になっていく様子は、"ホタルイカの身投げ"をイメージしています。前作のワームホールは画面の下にレイアウトして上下繋がるように意識ました。また、"タコやイカの生態の複雑さ"を"海底、海面、宇宙"を混ぜ合わせる事で表現しています。サンゴ、海藻、泡、星、宇宙、星雲、自分の中で深いつながりを感じています。今回発生したワームホールがEAの中でどのように展開していくのか自分でも楽しみです。
作業BGM：New Order『Music Complete: Remix』

[ニュース] AI関連

[画像] Black Forest Labs - FLUX.1

Stable Diffusionの元共同開発者達がBlack Forest Labsを設立して、FLUX.1という画像生成モデルを公開しました。Midjouneyを超えるクオリティで、プロンプトの正確性やテキストの精度も高いです。まだ公開されて間もないですが、ポテンシャルにかなり注目されていて、約1週間で、モデル容量の最適化、LoRA学習、ComfyUIなどかなりのスピードで開発が進んでいます。来週にはControlNetも対応されそうな勢いなので当分はトレンドになりそうな気がします。

[動画] Black Forest Labs - SOTA？

Black Forest LabsがSOTAという動画モデルの公開も計画しているとの事です。Demoを観る限り良い感じの精度なので、ローカル環境で動かせるモデルとして公開したら動画生成AI環境が変わるかもしれないです。急に出てきたBlack Forest Labsが楽しみすぎます。Open Model Initiativeにも参加して欲しいです。

[動画] CogVideo - 公開

一昨年に発表されて話題になっていたtext to videoのCogVideoがアップデートされて、オープンソースで公開されました。オープンソースモデルの中ではかなりクオリティが高く、kijaiさんが早速ComfyUIに実装してくれているのでこちらも検証してみようと思います。

[動画] LivePortrait - Animals mode

かなりのケースで活用させて頂いているLivePortraitがアップデートして動物にも対応してくれました。ケモナーとしてはかなり本当に助かります。

[3D] An Object is Worth 64x64 Pixels:
Generating 3D Object via Image Diffusion

遂に、綺麗なUVも一緒に生成す3D生成フレームワークが発表されました。

[LLM] OpenAI - OpenAI DevDay

We’re taking OpenAI DevDay on the road! Join us this fall in San Francisco, London, or Singapore for hands-on sessions, demos, and best practices. Meet our engineers and see how developers around the world are building with OpenAI.https://t.co/VI8UNJPJcf pic.twitter.com/zlrTAsb2TT
— OpenAI Developers (@OpenAIDevs) August 5, 2024

現状、次のモデルを発表する予定はないらしいですが、他にどのような発表があるか楽しみですね。

[動画] Runway - Gen-3 Alpha Image to Video Demo

Gen-3 Alpha Image to Video now supports using an image as either the first or last frame of your video generation. This feature can be used on its own or combined with a text prompt for additional guidance.

All examples below demonstrate using an image as the last frame.

(1/5) pic.twitter.com/koFBP7iKNf
— Runway (@runwayml) August 5, 2024

このアイデアもいいですね。

[動画] Expressive Whole-Body 3D Gaussian Avatar

360度回転する動画からアバターを制作し、別の動画のモーションにトランスファーするフレームワークです。それぞれスマホで撮った動画からこの精度は凄いですね。コードの公開が楽しみです。

[声] 「初音ミク V6 AI」年内発売へ AIで歌声の幅広げた「VOCALOID6」採用

遂に「初音ミク AI」のリリースが発表されました。新しいカルチャーや思想、文化を築いた初音ミクがAIになるというのは様々な視点で影響が大きいと思います。それがポジティブに影響して、ヒト、Vocaloid、ロボット、AIの緩やかな架け橋になっていって欲しいと心から願っています。

[動画] Domo AI - Move v2 Anime model

Dear Domos,

Super upgrade! “/move” has leveled up📢
Want to see which dance your favorite character does? Show us! 🤩

Happy creating
DomoAI Team pic.twitter.com/Pv3guB4gIa
— DomoAI official (@DomoAI_) August 6, 2024

DomoAIのAnime modelがアップデートされました。精度と一貫性が上がってますね。カジュアルにアニメ動画を生成したい場合は一番ちょうどいいサービスだと思います。

[LLM] MindSearch

Perplexity.ai Proと同等のパフォーマンスのLLMベース検索エンジン。こっちもオープンソース化の流れがあるんですね。

[マンガ] 生成AIを活用した日本初の社会人向け縦読み学習マンガ「LearningToon」プレサービスを期間限定で無料公開

自分がAIの開発で参加しているサービスです。プレサービスを期間限定で無料公開しているので、もしご興味がありましたら是非。

[動画] Alibaba - Tora

久しぶりのAlibabaさんですね。軌跡を描いて動画の動きをコントロールするフレームワークです。この手のやつは多いですが、中々気軽に使えるような状況にならないですね。Fluxの動画モデルなどが出た上で、このぐらいコントロールできるようになったら動画生成サービスはかなり厳しくなりそうですね。

[3D] XHand: Real-time Expressive Hand Avatar

リアルタイムで手のジオメトリーキャプチャーしてレンダリングするフレームワークです。かなり精度が高いですね。Vtuber関連でも活用できそうです。

[LLM] SuperMemory

SNSやWeb、メモなどからAI検索することが可能なハブとなるAI。オープンソースで使える。結構理想的なパートナーAIになりそうな気配があるプロダクトですね。

[AI活用] Runway Gen-3

Using last frame in Gen-3 Image to Video for generating visual effects is going to be a game changer. Doing this practically (or in 3D) is a time consuming and expensive process... but not anymore 😚 pic.twitter.com/WkBEdVmpEQ
— Always Generating (@notiansans) August 5, 2024

このような素材生成がかなり便利です。無制限に使える期間内で、グリーンバックのエフェクト素材やモーション素材の生成をしまくっています。

[画像] ikea instructions lora sdxl

イケアの説明書LoRAです。久しぶりにツボにはいりました。

[記事] AIの消費電力を最大2500分の1に削減する「CRAM」を研究者が実証

2500分の1は凄いですね。AIと消費電力はかなり重要な課題ですし、シンプルに家の電気代がとんでもないことになっているので、早急に組み込んで欲しいですｗ

[記事] 脳内の神経細胞で「量子もつれ」が発生してる？何百万の脳細胞間の同期活動を説明か上海大学が発表

この論文の発表は興味深いですね。量子もつれを可視化すると陰陽太極図のようになっていたという発表もあったので、なんとなくイメージがあるのはこれが理由だったりするのでしょうか？色々ワクワクしますね。

[記事] OpenAIの共同創設者ジョン・シュルマンが退職してAnthropicへ移籍

次々とOpneAIを離れてAnthropicにいってますね。

[ロボット] Introducing Figure 02

Figure 02 coming 8/6 pic.twitter.com/IxTr9f6YKb
— Figure (@Figure_robot) August 2, 2024

Meet Figure 02 - the world's most advanced AI hardware pic.twitter.com/OeFekIuxuA
— Figure (@Figure_robot) August 6, 2024

PVもかっこいい・・・。未来が来てますね。一家に"一人"になるのはいつになるか楽しみです。

[モーション] Hyfydy

Trying to teach my new model to run using reinforcement learning (Hyfydy + depRL) pic.twitter.com/Pi72cCcS6f
— Thomas Geijtenbeek (@tgeijten) August 1, 2024

歩くことを学習していく過程での転び方がリアリティを感じました。このソフトは全然知りませんでしたが、気になります。

[書籍] スクウェア・エニックスのAI

【電子版あります】目標としたのは、日本で最もわかりやすいゲームAI の本

■書籍『スクウェア・エニックスのAI』(7月末発売) https://t.co/HJfa30yllW #AI #スクエニ #人工知能 pic.twitter.com/jnYQkP67QY
— ボーンデジタル出版事業部 (@bd_publishing) July 31, 2024

執筆者代表が三宅陽一郎さんなので、すぐ購入しました。

[記事] 三宅陽一郎さん×新清士さんがゲームづくりを語る。生成AIで「変わること」「変わらないこと」

じっくり読みます。

[政府 / 法] 文化庁 - AIと著作権に関するチェックリスト＆ガイダンス

昨日公表された「AIと著作権に関するチェックリスト＆ガイダンス」ですが、とりあえず、今一番気になるのはガイダンス40頁「事前の対応②：AI学習用データとして販売するようにしておくこと〔考え方24頁〕」の記載です。https://t.co/JMkcfVWwC6… pic.twitter.com/T8VT0KgVHq
— 柿沼　太一 (@tka0120) August 1, 2024

AIと著作権に関するチェックリスト＆ガイダンスの資料はしっかりと読んでおきます。Storiaの柿沼太一先生の見解もありがたいですね。

[記事] 自分の作品に似たAIイラストがあったときの対応方法　文化庁が解説

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] Unreal Engine マーケットプレイスの無料コンテンツ - 2024年8月

This month’s free Unreal Engine Marketplace content includes subterranean city environments, knights in armor, an RPG template to level up your project ⬆️

Jump in and get 'em and so much more today!: https://t.co/T4Oc2yu3Xt pic.twitter.com/wDaASry8Q5
— Unreal Engine (@UnrealEngine) August 6, 2024

Weekly Report 2024/08/07 (wed)

自主制作 / 記事

Elemental Anima #0147

[ニュース] AI関連

[画像] Black Forest Labs - FLUX.1

[動画] Black Forest Labs - SOTA？

[動画] CogVideo - 公開

[動画] LivePortrait - Animals mode

[3D] An Object is Worth 64x64 Pixels:
Generating 3D Object via Image Diffusion

[LLM] OpenAI - OpenAI DevDay

[動画] Runway - Gen-3 Alpha Image to Video Demo

[動画] Expressive Whole-Body 3D Gaussian Avatar

[声] 「初音ミク V6 AI」年内発売へ AIで歌声の幅広げた「VOCALOID6」採用

[動画] Domo AI - Move v2 Anime model

[LLM] MindSearch

[マンガ] 生成AIを活用した日本初の社会人向け縦読み学習マンガ「LearningToon」プレサービスを期間限定で無料公開

[動画] Alibaba - Tora

[3D] XHand: Real-time Expressive Hand Avatar

[LLM] SuperMemory

[AI活用] Runway Gen-3

[画像] ikea instructions lora sdxl

[記事] AIの消費電力を最大2500分の1に削減する「CRAM」を研究者が実証

[記事] 脳内の神経細胞で「量子もつれ」が発生してる？何百万の脳細胞間の同期活動を説明か上海大学が発表

[記事] OpenAIの共同創設者ジョン・シュルマンが退職してAnthropicへ移籍

[ロボット] Introducing Figure 02

[モーション] Hyfydy

[書籍] スクウェア・エニックスのAI

[記事] 三宅陽一郎さん×新清士さんがゲームづくりを語る。生成AIで「変わること」「変わらないこと」

[政府 / 法] 文化庁 - AIと著作権に関するチェックリスト＆ガイダンス

[記事] 自分の作品に似たAIイラストがあったときの対応方法　文化庁が解説

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] Unreal Engine マーケットプレイスの無料コンテンツ - 2024年8月

[FX] ZibraVDB

いいなと思ったら応援しよう！

Weekly Report 2024/08/07 (wed)

自主制作 / 記事

Elemental Anima #0147

[ニュース] AI関連

[画像] Black Forest Labs - FLUX.1

[動画] Black Forest Labs - SOTA？

[動画] CogVideo - 公開

[動画] LivePortrait - Animals mode

[3D] An Object is Worth 64x64 Pixels:Generating 3D Object via Image Diffusion

[LLM] OpenAI - OpenAI DevDay

[動画] Runway - Gen-3 Alpha Image to Video Demo

[動画] Expressive Whole-Body 3D Gaussian Avatar

[声] 「初音ミク V6 AI」年内発売へ AIで歌声の幅広げた「VOCALOID6」採用

[動画] Domo AI - Move v2 Anime model

[LLM] MindSearch

[マンガ] 生成AIを活用した日本初の社会人向け縦読み学習マンガ「LearningToon」プレサービスを期間限定で無料公開

[動画] Alibaba - Tora

[3D] XHand: Real-time Expressive Hand Avatar

[LLM] SuperMemory

[AI活用] Runway Gen-3

[画像] ikea instructions lora sdxl

[記事] AIの消費電力を最大2500分の1に削減する「CRAM」を研究者が実証

[記事] 脳内の神経細胞で「量子もつれ」が発生してる？何百万の脳細胞間の同期活動を説明か 上海大学が発表

[記事] OpenAIの共同創設者ジョン・シュルマンが退職してAnthropicへ移籍

[ロボット] Introducing Figure 02

[モーション] Hyfydy

[書籍] スクウェア・エニックスのAI

[記事] 三宅陽一郎さん×新清士さんがゲームづくりを語る。生成AIで「変わること」「変わらないこと」

[政府 / 法] 文化庁 - AIと著作権に関するチェックリスト＆ガイダンス

[記事] 自分の作品に似たAIイラストがあったときの対応方法 文化庁が解説

[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] Unreal Engine マーケットプレイスの無料コンテンツ - 2024年8月

[FX] ZibraVDB

いいなと思ったら応援しよう！

[3D] An Object is Worth 64x64 Pixels:
Generating 3D Object via Image Diffusion

[記事] 脳内の神経細胞で「量子もつれ」が発生してる？何百万の脳細胞間の同期活動を説明か上海大学が発表

[記事] 自分の作品に似たAIイラストがあったときの対応方法　文化庁が解説