マガジンのカバー画像

Image Generation

157
運営しているクリエイター

2024年7月の記事一覧

立体視出来るステレオ動画をComfyUIで生成する(mp4変換フロー):Xreal Air用

立体視出来るステレオ動画をComfyUIで生成する(mp4変換フロー):Xreal Air用

今回は表題通り、生成したAI動画をxreal airで立体視で見ることが出来るステレオ動画に変換する方法になります。

基本は、前回記事で取り上げたDepth anything2とNegitoolsを使用した方法を使います。

試しに、以前生成したAI動画をステレオ動画化してみたいと思います。
プロパティで、FPS、フレーム数を予め確認しておきます。

この動画だと、10FPSで60フレームでした

もっとみる
そうだ!AI画像生成をちゃんと勉強しよう💡5章:サンプラーとスケジュールタイプについて

そうだ!AI画像生成をちゃんと勉強しよう💡5章:サンプラーとスケジュールタイプについて

※勉強しているのは、Stable Diffusion、SeaArt系になります。

パラメータ…いつもStable DiffusionやSeaArtをいじっていて、見て見ぬふりをしているもののひとつ。
まだ黒い霧がかかっていて何が何だか想像すらできない存在の番がきてしまいました…気合を入れて勉強します

しかし等身大は崩さずやっていきたいと思いますよろしくお願いします(。ì _ í。)

なお今回

もっとみる
【StableDiffusion】VRoidからつくる衣装LoRA制作メモ【データセット付き】

【StableDiffusion】VRoidからつくる衣装LoRA制作メモ【データセット付き】

■記事の対象ユーザ
1.SDXLのLoRAを作っている(=つよつよグラボを持っている)
2.衣装LoRAを作ってみたが上手く行かない
3.データセットとキャプションをどうしたら良いか判らない

■ようするに?

はじめにちょっと前に「コピー機学習法」による差分LoRA作りの記事で書いたことで
「おで、LoRA、すこしわかる」程度になった気でいたんだけど、調子に乗って同じ感覚で服LoRAにも挑戦した

もっとみる
A letter from Japanese animators to CG/AI researchers around the world. / Problems with using AI inJapanese anime. SIGGRAPH2024

A letter from Japanese animators to CG/AI researchers around the world. / Problems with using AI inJapanese anime. SIGGRAPH2024

This document reveals the challenges of utilizing generative AI in the Japanese anime production environment, as identified by a survey conducted by the Digital Content Association of Japan (DCAJ). By

もっとみる
Google ColabでSakana AIのEvo-Ukiyoeを試してみた

Google ColabでSakana AIのEvo-Ukiyoeを試してみた


概要Google Colab (Pro)でSakana AIの浮世絵生成AI Evo-Ukiyoeを試してみました。

入力プロンプトには有名な俳句の紹介記事を参考に10句使用しました。

必要なGPUメモリは約33.4GBでした。

実施内容必要となるもの

Google Colabへの課金 (GPUメモリの問題で、A100が必要でした)

Hugging Faceのアカウントとトークン

J

もっとみる
Sakana AIより「日本の美を学んだAI」が公開

Sakana AIより「日本の美を学んだAI」が公開

2024年7月22日、日本の経済産業省(METI)傘下のNEDOやNTTドコモ・ベンチャーズ(NDV)、KDDIが出資し、推定45億円を調達している AI研究開発スタートアップの「Sakana AI(サカナAI)」(東京都港区)が、「日本の美を学んだAI」を公開しました。

このリリースの要点は以下の通りです。

Evo-Ukiyoeは、日本語のプロンプトを入力すると浮世絵風の画像を生成します。風

もっとみる

論文解説 Ada-adapter:Fast Few-shot Style Personlization ofDiffusion Model with Pre-trained Image Encoder

ひとことまとめ

概要StableDiffusionなどのText-to-Imageモデルを特定のスタイルに最適化する研究は複数行われている。例えばDreamBooth、LoRA、Textual Inversionなどがあげられる。しかしながら品質を上げるためには大量の画像が必要である。そこでIP-Adapterなどの事前学習済みモデルを使用し効率的にstyleのみを学習する手法を提案する。提案手

もっとみる
【SDWebUI】Extrasで画像をアップスケールする方法

【SDWebUI】Extrasで画像をアップスケールする方法

初心者の方やExtrasを使ったことがない方に向けて、Stable Diffusion Web UI(以下SDWebUI)のExtrasタブを使った画像アップスケール方法をご紹介します。
※A1111・forgeどちらでも操作方法は一緒です。

■プロフィール
自サークル「AI愛create」でAIコンテンツの販売・生成をしています。
クラウドソーシングなどで個人や他サークル様からの生成依頼を多数

もっとみる
WindowsでPaints-Undoから派生したSketch-Genを試す(VRAM 6GB以上?)

WindowsでPaints-Undoから派生したSketch-Genを試す(VRAM 6GB以上?)

Last update 7-18-2024
※(7-18)本文を若干変更しました(線画は3種類のモデルを使用、Num Setsはバリエーションの数、微修正)。
※Sketch-Gen(Sketch/Lineart extractor)はPaints-Undoをベースにしているため、利用前にそちらの免責事項を必ず確認してください。

▼ 0. 本記事について0-1. 概要

 本記事では、Sketc

もっとみる
WindowsでPaints-Undoを試す(VRAM 12GB以上)

WindowsでPaints-Undoを試す(VRAM 12GB以上)

Last update 7-14-2024
※(7-14) Paints-Undoをベースに、線画とスケッチの生成に特化したSketch-Genの記事を書きました。
※利用前に、リポジトリの最後に書いてある免責事項を必ず確認してください。

▼ 0. 本記事について0-1. 概要

 本記事では、Paints-UNDOをインストールして実行する手順を紹介します。こちらの作者は、ControlNet

もっとみる
画像生成AIモデル「Kolors」の使用経験

画像生成AIモデル「Kolors」の使用経験

 こんにちは、Browncatです。
 中国のKuaishou Technology社(快手科技)は7月6日、画像生成AIモデル「Kolors」をリリースしました。
 Kolorsは学習ネットワークはSDXLと同じくU-Netですが、テキストエンコーダとして、CLIPやT5ではなくChatGLM3を用いているのが特徴です。
 そこでKolorsの生成結果を、Midjourney、DALL-E 3、

もっとみる
【画像生成AI】 自然な文章で思い通りの画像生成を実現する最先端モデル『Kolors』を試してみた

【画像生成AI】 自然な文章で思い通りの画像生成を実現する最先端モデル『Kolors』を試してみた

Stable Diffusionでの画像生成の欠点は、生成したい画像の情景をカンマ区切りのタグで入力するので、思った通りの画像を生成できないことでした。
この問題の解決に繋がる研究成果がKuaishou Technologyよりもたらされました。Kuaishouは、GML (General Language Model)を用いて、英語と中国語の理解力が強化されたモデル『Kolors』を発表しました

もっとみる