見出し画像

Weekly Report 2024/08/07 (wed)

個人的に気になったニュースや自主制作などの週報メモです。


自主制作 / 記事

Elemental Anima #0147

前作はタコだったので、今作はホタルイカをモチーフにしました。右の泡から星になっていく様子は、"ホタルイカの身投げ"をイメージしています。前作のワームホールは画面の下にレイアウトして上下繋がるように意識ました。また、"タコやイカの生態の複雑さ"を"海底、海面、宇宙"を混ぜ合わせる事で表現しています。サンゴ、海藻、泡、星、宇宙、星雲、自分の中で深いつながりを感じています。今回発生したワームホールがEAの中でどのように展開していくのか自分でも楽しみです。
作業BGM:New Order『Music Complete: Remix』


[ニュース] AI関連

[画像] Black Forest Labs - FLUX.1

Stable Diffusionの元共同開発者達がBlack Forest Labsを設立して、FLUX.1という画像生成モデルを公開しました。Midjouneyを超えるクオリティで、プロンプトの正確性やテキストの精度も高いです。まだ公開されて間もないですが、ポテンシャルにかなり注目されていて、約1週間で、モデル容量の最適化、LoRA学習、ComfyUIなどかなりのスピードで開発が進んでいます。来週にはControlNetも対応されそうな勢いなので当分はトレンドになりそうな気がします。


[動画] Black Forest Labs - SOTA?

Black Forest LabsがSOTAという動画モデルの公開も計画しているとの事です。Demoを観る限り良い感じの精度なので、ローカル環境で動かせるモデルとして公開したら動画生成AI環境が変わるかもしれないです。急に出てきたBlack Forest Labsが楽しみすぎます。Open Model Initiativeにも参加して欲しいです。


[動画] CogVideo - 公開

一昨年に発表されて話題になっていたtext to videoのCogVideoがアップデートされて、オープンソースで公開されました。オープンソースモデルの中ではかなりクオリティが高く、kijaiさんが早速ComfyUIに実装してくれているのでこちらも検証してみようと思います。


[動画] LivePortrait - Animals mode

かなりのケースで活用させて頂いているLivePortraitがアップデートして動物にも対応してくれました。ケモナーとしてはかなり本当に助かります。


[3D] An Object is Worth 64x64 Pixels:
Generating 3D Object via Image Diffusion

遂に、綺麗なUVも一緒に生成す3D生成フレームワークが発表されました。


[LLM] OpenAI - OpenAI DevDay

現状、次のモデルを発表する予定はないらしいですが、他にどのような発表があるか楽しみですね。


[動画] Runway - Gen-3 Alpha Image to Video Demo

このアイデアもいいですね。


[動画] Expressive Whole-Body 3D Gaussian Avatar

360度回転する動画からアバターを制作し、別の動画のモーションにトランスファーするフレームワークです。それぞれスマホで撮った動画からこの精度は凄いですね。コードの公開が楽しみです。


[声] 「初音ミク V6 AI」年内発売へ AIで歌声の幅広げた「VOCALOID6」採用

遂に「初音ミク AI」のリリースが発表されました。新しいカルチャーや思想、文化を築いた初音ミクがAIになるというのは様々な視点で影響が大きいと思います。それがポジティブに影響して、ヒト、Vocaloid、ロボット、AIの緩やかな架け橋になっていって欲しいと心から願っています。


[動画] Domo AI - Move v2 Anime model

DomoAIのAnime modelがアップデートされました。精度と一貫性が上がってますね。カジュアルにアニメ動画を生成したい場合は一番ちょうどいいサービスだと思います。


[LLM] MindSearch

Perplexity.ai Proと同等のパフォーマンスのLLMベース検索エンジン。こっちもオープンソース化の流れがあるんですね。


[マンガ] 生成AIを活用した日本初の社会人向け縦読み学習マンガ「LearningToon」プレサービスを期間限定で無料公開

自分がAIの開発で参加しているサービスです。プレサービスを期間限定で無料公開しているので、もしご興味がありましたら是非。


[動画] Alibaba - Tora

久しぶりのAlibabaさんですね。軌跡を描いて動画の動きをコントロールするフレームワークです。この手のやつは多いですが、中々気軽に使えるような状況にならないですね。Fluxの動画モデルなどが出た上で、このぐらいコントロールできるようになったら動画生成サービスはかなり厳しくなりそうですね。


[3D] XHand: Real-time Expressive Hand Avatar

リアルタイムで手のジオメトリーキャプチャーしてレンダリングするフレームワークです。かなり精度が高いですね。Vtuber関連でも活用できそうです。


[LLM] SuperMemory

SNSやWeb、メモなどからAI検索することが可能なハブとなるAI。オープンソースで使える。結構理想的なパートナーAIになりそうな気配があるプロダクトですね。


[AI活用] Runway Gen-3

このような素材生成がかなり便利です。無制限に使える期間内で、グリーンバックのエフェクト素材やモーション素材の生成をしまくっています。


[画像] ikea instructions lora sdxl

イケアの説明書LoRAです。久しぶりにツボにはいりました。


[記事] AIの消費電力を最大2500分の1に削減する「CRAM」を研究者が実証

2500分の1は凄いですね。AIと消費電力はかなり重要な課題ですし、シンプルに家の電気代がとんでもないことになっているので、早急に組み込んで欲しいですw


[記事] 脳内の神経細胞で「量子もつれ」が発生してる?何百万の脳細胞間の同期活動を説明か 上海大学が発表

この論文の発表は興味深いですね。量子もつれを可視化すると陰陽太極図のようになっていたという発表もあったので、なんとなくイメージがあるのはこれが理由だったりするのでしょうか?色々ワクワクしますね。


[記事] OpenAIの共同創設者ジョン・シュルマンが退職してAnthropicへ移籍

次々とOpneAIを離れてAnthropicにいってますね。


[ロボット] Introducing Figure 02

PVもかっこいい・・・。未来が来てますね。一家に"一人"になるのはいつになるか楽しみです。


[モーション] Hyfydy

歩くことを学習していく過程での転び方がリアリティを感じました。このソフトは全然知りませんでしたが、気になります。


[書籍] スクウェア・エニックスのAI

執筆者代表が三宅陽一郎さんなので、すぐ購入しました。


[記事] 三宅陽一郎さん×新清士さんがゲームづくりを語る。生成AIで「変わること」「変わらないこと」

じっくり読みます。


[政府 / 法] 文化庁 - AIと著作権に関するチェックリスト&ガイダンス

AIと著作権に関するチェックリスト&ガイダンスの資料はしっかりと読んでおきます。Storiaの柿沼太一先生の見解もありがたいですね。


[記事] 自分の作品に似たAIイラストがあったときの対応方法 文化庁が解説


[ニュース] CG・ゲーム・リアルタイムエンジン関連

[Epic] Unreal Engine マーケットプレイスの無料コンテンツ - 2024年8月


[FX] ZibraVDB


この記事が気に入ったらサポートをしてみませんか?