![見出し画像](https://assets.st-note.com/production/uploads/images/157186254/rectangle_large_type_2_2913b52a46d876726f4764575013096f.png?width=1200)
Weekly Report 2024/10/09 (wed)
個人的に気になったニュースや自主制作などの週報メモです。
自主制作 / 記事
Elemental Anima #0156
Elemental Anima #0156
— takio koizumi | takion.eth (@takion0105) October 6, 2024
Created by :
takio koizumi (Human) x HAL (AI)
🔽Detail / Link pic.twitter.com/5lW8ZhrjTJ
今作で江の島シリーズ最後の作品になります。江の島には至る所に龍が居ました。"江島縁起"に描かれた"天女と五頭龍"という物語がルーツとの事。今作は、藤沢市龍口山から江島明神として奉られている弁財天を見守っている五頭龍の石像をモチーフにしました。5つの頭をある程度の整合性を意識して表現するのはかなり難しかったです。
自分は辰年なので今年中に江島神社でお参りが出来てよかったです。旅行した際に印象に残ったものや疑問に思った事を調べて、想い出と共に作品にする事でしっかり記憶されて良いですね。色々な所に旅行したいです。
作業BGM:谷山浩子『タニヤマヒロコノピアノアルバム』
[データセット] 江島神社 / 江の島岩屋 / 龍
【データセット】
— takio koizumi | takion.eth (@takion0105) October 6, 2024
江島神社 / 江の島岩屋 / 龍神 pic.twitter.com/8ggsmUKljE
[お知らせ] 第50回 自由が丘女神まつり 秋のマリクレール祭り2024 アートマルシェ
☯出展のお知らせ☯
— takio koizumi | takion.eth (@takion0105) October 6, 2024
第50回 #自由が丘女神まつり
秋のマリクレール祭り2024 アートマルシェ
場所:自由が丘駅南口メルサ自由が丘店パート2横
日程:10/13(日),14(月)
イベント詳細https://t.co/uoM5mPlgfw
イベントポスターも制作しております!
ご興味がありましたら是非!#自由が丘 pic.twitter.com/aBTbT6ayz1
今週末に自由が丘で開催する女神まつりの中のアートマルシェで出展いたします!アートマルシェイベントポスターも制作させていただきました!ご興味がりましたら是非お越しくださいませ!
[お知らせ] CGWORLD vol.315 (2024年11月号)
10月10日(木)発売の”CGWORLD vol.315”にデジタルハリウッド大学の卒業生として、自分のインタビュー記事が掲載していただきました!ずっと購読していた雑誌にインタビューと共にElemental Animaが掲載されるのも感慨深いです!ご興味がありましたら是非購読して下さいませ!
[ニュース] AI関連
[動画] Meta - Movie Gen
遂にMetaの動画生成AIが発表されました。他の動画生成AIサービスとは違うアプローチとしては動画から効果音やBGMも生成できる点とパーソナライズですね。しっかりとPaperも公開している点も素晴らしいです。データセットに関しては、"ライセンスされたデータセットや公開されているデータセットを組み合わせてモデルを学習させた"との事です。そして、"StreamDiffusion"を開発した日本のエンジニアであるAkiさんもプロジェクトに参加されているそうです。どういった形での公開になるのか楽しみです。
[企業] Adobe - Adobe Max 2024 10/14-16
来週はAdobe MAXが開催されます。ここでの発表内容によって、生成AI関連の情勢がかなり変わってくるような気がしています。Fireflyの動画生成のBetaが公開されたら嬉しいですね。個人的にはこの動画生成AIのセッション"Creativity Super Session: Video and AI"が楽しみです。昨年のAdobe MAXでの生成AI関連の発表がどれだけ実現できたかによって、株価への影響もあると思うのでAdobeは正念場だと思います。
[動画] Runway - Foundations for Safe Generative Media
Runwayの次のアプローチとしては安全性に対してのポリシーの発信です。C2PAも採用していたり、バイアスコントロールなど、"生成時と生成後のルール"に対しての発信は素晴らしいと思います。ですが、生成前のデータセットやモデルデータに対しては殆ど触れていない事が気になってしまいますね。
[動画] Runway - Gen-3 Alpha Turbo Image to Video
You can now provide both first and last frame inputs for Gen-3 Alpha Turbo. Available for all users on web in both horizontal and vertical aspect ratios. pic.twitter.com/JsdEqGYf3P
— Runway (@runwayml) October 8, 2024
Gen-3 Alpha Turboでも最初と最後のフレームの指定が出来るようになり、縦のアスペクト比にも対応しました。
[動画] Hailuo AI - Image to Video
🌟 The wait is finally over ——We are excited to announce the launch of our Image-to-Video feature! 🎬✨
— Hailuo AI (@Hailuo_AI) October 8, 2024
What distinguishes Hailuo's Image2Video experience?
- Text-and-image joint instruction following: Hailuo seamlessly integrates both text and image command inputs, enhancing… pic.twitter.com/ke59EjtmBB
Hailuoという動画生成AIでもImage to Videoに対応しました。現在無料で生成できるのでご興味がありましたら是非。
[画像] Black Forest Labs - FLUX1.1 [pro]
FLUX1.1 [pro]がAPIでの利用のみで公開されました。[dev]を活用してますが、生成速度が遅いのがかなりネックだったので早くなるのはシンプルにありがたいですね。あわよくば、FLUX1.1 [dev]もモデルも含めて公開して頂けるとありがたいですが、StabilityAIの反省を踏まえたマネタイズもうまくやってる感じはします。年内に動画生成AIを出すのか気になるところですね。
[動画] HeyGen - Avatar 3.0 with Unlimited Looks
HeyGen just dropped Avatar 3.0 with Unlimited Looks.
— Min Choi (@minchoi) October 7, 2024
Now anyone can clone themselves with AI and unlock multiple poses, outfits, and camera angles.
Here's how: pic.twitter.com/8bFSP9E2D6
アバター関係はHeyGenがトップクラスですね。Unlimited Looksでカメラアングルや衣装・ポーズまで変えられるようになりました。もうここまで来るとAIアバターなのか分からないです・・・。
[画像] Apple - Depth Pro
Appleから高速で精度の高いDepth生成が出来るモデルが公開されました。実写系にかなり強いですね。早速ComfyUIのカスタムノードも出ていたので、Depth関連はこっちに移行しようと思います。
[声] 青二プロダクションとCoeFontがパートナーシップを締結
【青二プロダクション様とパートナーシップを締結】
— CoeFont (コエフォント) (@coefont) October 7, 2024
声優事務所の青二プロダクション様と声の可能性を広げるための取り組みを開始します。
野沢雅子さんをはじめとする人気声優の多言語化したAI音声を提供します。
お問い合わせや詳細はコメント欄のプレスリリースをご覧ください。 pic.twitter.com/3aMWE0xLz5
これは興味深いアプローチですね!ナビゲーション音声などの演技を必要としない分野での提供というルールも良いです。社会や業界の反応も含めてどんな展開になっていくのか楽しみです。
[画像] Stability AI - quintuples the API costs for SDXL and SD 1.6
![](https://assets.st-note.com/img/1728379494-RiXcDnHo2OJVjkIGeEf0zT3s.png?width=1200)
SDXLとSD1.6のAPIコストを5倍に変更は凄いですね。Black Forest Labsも出てきてしまったので、Stability AIは色々厳しそうですね。キャメロンも参加したので、大きく変化する為の準備中だと思いますが、もう少し早めにアナウンスは欲しいですね。
[動画] Hotshot - Personalized Video Gens
We have released Personalized Video Gens ✨
— Hotshot (@HotshotSupport) October 6, 2024
Upload up to five images of yourself and instantly generate videos from a text prompt.
No fine-tuning, no wait times: pic.twitter.com/tn629ptDQg
Hotshotという動画生成AIサービスではパーソナライズした動画生成が出来るようになりました。
[動画] Inverse Painting: Reconstructing The Painting Process
Paint Transformerをよく使っていたので嬉しいですね。タイムラプスではあるので物議は醸しそうですが・・・。色々な表現に活用できそうです。
[AI活用] Filming a sketch + Runway's video-to-video
Filming a sketch I made and taking it through Runway's video-to-video AI… The result really surprised me! 🤯 It's amazing how fast tech can turn simple ideas into something so polished (if you disregard the strange hands ofc)! Do you think this kind of tool has a place in your… pic.twitter.com/8YEx25X6MF
— Martin Nebelong (@MartinNebelong) October 6, 2024
この発想は面白いですね。
[画像] Posterior-Mean Rectified Flow - Demo公開
ボケた画像や解像度の低い画像を修復するフレームワークです。過去に紹介しましたが、今回huggingfaceのデモが公開されました。LivePortraitで表情をコントロールする際に、トリミングして解像度を上げ際に活用しています。
[画像] blinkshot
ブラウザ上でログインもなく、無料でFluxがリアルタイム生成できます。一定量生成すると24時間使えなくなりますが、すぐ簡易的にプロンプトを試したい場合は便利です。
[動画] kijai - CogVideoX-Fun
I've been deep into CogVideoX -code lately. Using the CogVideoX-Fun "pose" model allows control with variety of inputs, and applying Kosinkadink's context windowing from AnimateDiff (thanks to ) I've managed some decently stable longer generations.#ai #cogvideox pic.twitter.com/rmdK7PksZj
— Jukka Seppänen (@Kijaidesign) October 6, 2024
ComfyUIのカスタムノードで、いつもお世話になりまくってるkijaiさんがCogVideoXのコントロールをWipを挙げていました。これが公開されたらCogVideoXを本格的に検証したいと思います。
[3D] nVidia - EdgeRunner
画像やポイントクラウドから自己回帰型で3Dメッシュを生成。4000faceまでですが、見た感じ精度がかなり高いですね。
[ComfyUI] camenduru - Depth Pro with Depth Flow
Depthを活用したカメラコントロールワークフローです。過去にかなり活用していました。ComfyUIで再現できるのは嬉しいですね。試してみようと思います。
[動画] FacePoke
This AI demo is the most mind-blowing thing you'll experience this week! 🤯
— Victor M (@victormustar) October 5, 2024
⬇️ Link to the real-time demo pic.twitter.com/etg2eeTtwJ
LivePortraitを活用したリアルタイムデモです。hugging faceのデモがあり画像を入れるとすぐ使えるのでご興味がありましたら是非。
[論文] Awesome Anime Research
AnimeやComic関連の論文がまとまっています。カテゴリー分けもされていてとてもアクセスしやすいので助かります。
[マンガ] 松山せいじ - エイケン リメイク版
このリメイク版は自分は作画していないのですが、生成AIを活用した製作チームが一人1日がかりで一枚仕上がるくらいの手間暇だそうです。
— エイケン作者告知専用 (@kiri_miso) October 8, 2024
AIに投げてポンっ!ってわけでもない。
『エイケン リメイク版/松山せいじ』を無料で試し読み!まんがレポ2件|まんが王国 https://t.co/Dm8GV2Jhxw pic.twitter.com/oBihv1fH0q
作者自身が過去の漫画を生成AIでリメイクするというのは興味深いアプローチですね。LoRAの制作などどこまで踏み込んでいるかはわかりませんが、活用し続けた先に、表現や画風、ワークフローがどの様に落ち着くのか楽しみです。
[LLM] Google - 日本語版 Gemma 2 2B を公開
ちょうどComfyUIで日本語プロンプトからの生成ワークフローを組む必要が出ててきたので、こちらを活用してみようと思います。
[記事] もうでかいVRAMに高い金を払う必要は無くなるかもしれないのか?超分散LLM推論環境が爆誕
自分もなんとなくそんな気がしています。家にある大量のGPUを分散で活用したいです。
[記事] 「AI俳優」の起用に制限 ハリウッド組合が守った人の価値
「AI俳優」の起用に制限 ハリウッド組合が守った人の価値 - 日経デジタルガバナンス https://t.co/5UxOeUBuhl
— 柿沼 太一 (@tka0120) October 7, 2024
AIに関する規制で話題の?カリフォルニア州でデジタルレプリカ(生成AIで俳優の声や肖像を再現するもの)に関する2つの州法が成立したとの記事です。…
柿沼さんが見解についても話されていました。つい最近だと"エイリアン:ロムルス"でも”AB1836”に関連する表現がありました。今作での活用は個人的にはかなりポジティブに受け入れられました。CGでの再現とAIでの再現。色々な議論に発展していきそうです。
[記事] OpenAIの「Sora」の共同リーダーがGoogle DeepMind入り
次々とOpenAIから抜けていきますね・・・
[記事] 2024年のノーベル物理学賞は“AIの父”、ジェフリー・ヒントンなどが受賞
ノーベル物理学賞の受賞は凄いですね。受賞おめでとうございます。
[記事] 桂文枝、生成AIと共作で“創作落語” 手応え十分「落語というのは“心”です」
面白い試みですね。桂文枝さんのコメントもポジティブ良いです。