マーマレード男爵

広告代理店でコピーライター&イラストレーター。 ゲーム開発会社でスーパーファミコンやバーチャボーイソフトなどのグラフィック、企画、ツールの開発、人事。 その後は3D CG制作に映像編集。 両親の介護を終え、今はもうのんびりと楽しい事やりたいだけ。

マーマレード男爵

広告代理店でコピーライター&イラストレーター。 ゲーム開発会社でスーパーファミコンやバーチャボーイソフトなどのグラフィック、企画、ツールの開発、人事。 その後は3D CG制作に映像編集。 両親の介護を終え、今はもうのんびりと楽しい事やりたいだけ。

マガジン

最近の記事

VRAM 4GB で Flux.1 schnell

最小スペック云々見かけたのでさすがに動かないだろう・・・と思っていたら、意外や意外、動きました。 SDXLもそうでしたが、起動して最初にモデルを読み込む時だけ若干時間がかかりますが、あとは1024*1024で5~6分。 まぁ、オンラインサービスオンリーよりは選択肢が増えるという程度で。 ※8/19追記 ちなみに512*512だと4分ちょい。サイズを小さくしてもそれほど速くはならない。 モデルをGGUF形式に変更し(モデルの読み込みは速くなります)、Q4で4分強、Q8で7分強

    • KLING AI 使ってみた

      Soraが中々一般公開されない中、今まで中国在住にしか使えなかったKLING AIが世界に向けて公開。 Luma Dream Machinも凄かったけど、これは壁がひとつ崩れた感じ。 (下記画像は全てText2Video 、GIFに変換するのに 1280*720 30fps → 640*360 15fps に落としています。) アカウントを作成するのにパズルを嵌める認証があるのですが、 ドラッグするのは上の写真ピースではなく、下の「>>」部分です。

      • ComfyUI 動画のフェイススワップ

        ReActorなので髪型・顔の輪郭等は元のまま、眼鏡もなくなりますが。 総フレーム数を調べる 今回の作業に必要ありませんが、覚えておくと便利かなと frame_count に数値が整数型(Integer)で入ってますので文字列型(String)に変換して表示する。 CR Integer To String (Comfyroll Studio) Show Text (pythongosssss/ComfyUI-Custom-Scripts) 1697フレームでした。 取

        • ComfyUI LivePortrait

          LivePortrait用のノード、いくつかありますが、他のノードでも色々利用させてもらっているkijaiさんのノードを入れました。 (後ほど調べた所、shadowcz007さんのノードは複数人物にも対応しています) 「examples」の中にワークフローが、 「assets/examples」の中にドライビング動画(モーション参照用)が入ってます。 dsize アニメーション画像の出力サイズ vx_ratio, vy_ratio 顔の特徴の幅、高さを調整 lip_zer

        マガジン

        • Delphiで遊んでみる
          2本
        • 3D CG実験室
          3本
        • 合成音声実験室
          7本

        記事

          ほぼ雑記:AnimateDiff-Lightning

          うん、AnimateLCMより速い。 ここ数日悩んでいた事。 何かノードをいじった弾みで画像がボケボケになる、色が燻る。 ひとつ理由が判明。縦長 512*768 で生成した時、頭が縦に2つ重なる現象(モデルの学習サイズが 512*512 の時になる奴) が出たのでDeep Shrink を挟んでいたのだけど、ステップ数が影響するのかボケてしまう。 Deep Shrink入れてない物でもなる物あるので、他にも原因ありそうな気がする。 loop処理も関係あるのかな?と比較し

          ほぼ雑記:AnimateDiff-Lightning

          SeaArt で 動画生成

          ComfyUIWeb は思った通り、翌日にはタスク80などとなって、なかなか順番回ってこなかったり、動画系のモデルも外されたり。当然。 Luma Dream Machine も同時キューが1本のみになって待ち10時間とか。 本当はPixAIがComfyUI実装のベータテストやってたので、そのうち公開されるかな?と思ってたけど、まだ未定。 よし、SeaArtでStable Video Diffusion やってみよう。 Checkpoint:img2vid-xt-1.1

          Luma Dream Machine やってみた

          性懲りもなく映画の予告編ごっこ。 宇宙船の戦闘部分(3カット)だけテキストで入力。 残りは以下の6枚の生成した画像を放り込んで。 Model は Juggernaut XL  どうもテキスト入力では思ったように表現できないし、 img2videoは破綻もほとんどないので、絵コンテのようにカット毎の画像を生成して中割作って貰う方が綺麗かなと。

          Luma Dream Machine やってみた

          低VRAMご用達サイト

          人が増えても困るのでこっそりと・・・。 どうせ放っておいても、低VRAMやGPUがない層が押し寄せて混雑するに違いない。 オンラインでComfyUIが使えるサイト。 アカウント不要 当然、modelの数は限られているし、自分のLoRAは使えませんが。 Queueに他の利用者のタスクが追加されますが、 今のところ10を超えるのを見たことありません。

          低VRAMご用達サイト

          ComfyUI IPAdapter + ReActor

          以前、IPAdapterの記事を書いた時、「う~ん、まぁ雰囲気は出るけど、"LoRAの代わりになる"は言い過ぎじゃね?」と思った物でした。 そして、先日の記事でReActorを使ってみた所 「ディテールはいいんだけど、髪型や顔の輪郭がなぁ・・・」 という訳でワークフロー組んでみました。 ちなみにRoopってのもあるのですが、うちではエラー起きるんですよね。 著名人の顔の方がわかりやすいと思うけど、さすがにダイレクトに画像貼るのもマズイ気がしてきたので画面キャプチャにし

          ComfyUI IPAdapter + ReActor

          Reactor ? FaceDetailer ?

          人物の再現度なんて、TVや映画などでよく見かける顔、もしくは特別その人物ファンじゃないとわからないと思いますので、あくまでも個人的な検証。 ビートルズでも認知度は他の二人より低いリンゴとジョージ。 以前に書いた記事のやり方で、LoRAで生成してみる。 LoRA自体、1年前に50枚ほど画像を突っ込んで雑に作った物。 見直すと素材の解像度からして雑。 やはりLoRA同時使用は混ざってしまう、という感じ。 影響しないように画像を分割してそれぞれにFace Detailerをかけ

          Reactor ? FaceDetailer ?

          ComfyUI 複数人物のフェイススワップ

          Reactor を使います。 たったこれだけ。 なぜかハーマイオニーのレイア姫にノイズ入ってしまった。 それにしてもロンが恰好いい。ハリーのルークも似合ってるけど。 LordImage と SaveImage 以外に使用するのはノード2つだけです メインノード ノイズ取れないか試したので数値変わってるけど、ここはデフォルトで問題ないと思います。 FACE_MODEL は 顔モデルとして保存したり再利用したりできます。 input_image に置き換える全体の画像 so

          ComfyUI 複数人物のフェイススワップ

          ComfyUI LayerStyle

          OpenAIArtなどのワークフローを試していると、いろんなノードが入ってしまってカオス状態なのですが、ポストプロセス・画像処理系はひとつ欲しいなとは思ってました。 同様のノード集はいくつかありますが、ちょっと便利かなと思った物で。 ComfyUI LayerStyle 多機能なのでGithubの画像だけでも見れば大体どの辺の事ができるかわかると思いますが、画像をレイヤー分けやマスク処理してPhotoshopのような画像処理をComfyUIに組み込んでしまおうと。 ちなみ

          VRAM 4GB でも動画を作りたい

          動画やLoRA学習はオンラインサービスで・・・というスタンスでやってたのですが、ComfyUI触るようになって「解像度を落とせばそれなりに動く」とわかりました。それならもう少し探ってみようと。 生成AIで動画を作る方法は ・Text2Video (プロンプトで生成), ・Img2Video (画像イメージから生成), ・Video2Video (ビデオをスタイル転送) の3種ありますが、今の所Video2Videoの軽量化に難航中。 (動くには動くのですが、数秒で3時

          VRAM 4GB でも動画を作りたい

          お葬式の遺影と想像・創造力

          5年ほど前に母親が亡くなったのですが、その時の話。 お葬式の時に故人の遺影を作るのはご存知だと思います。 先に逝った父親の葬式は写真を渡しそれをシンプルに引き延すだけでした。 母親の時は、背景・額縁・衣装・リボンの色、好きな物を決めて生前の写真を渡すとお通夜までにコラージュができあがるといった内容でした。 このテンプレートの種類が非常に多かったのです。 服の種類も色や柄、洋装・和装と20種類以上、背景写真も何十種類、リボンの種類・・・。 うちには嫁いだ妹が一人いて、旦那さ

          お葬式の遺影と想像・創造力

          FLMASK事件を思い出す

          映画「Winny」 このツイートを見て、ちょっと書いてみようと思っていたのですが、 気がついたら月が変わっていました。 私はWinnyや作者の金子勇氏に関しては思い入れはありません。 ただWinnyが P2P(ピュア・トゥ・ピュア)というプロトコルを利用しているというだけで、「P2Pは犯罪である」という間違った認識が広まり、P2Pという言葉を聞くだけで他人を叩く人が出てきたのには困った物でした。 こういった誤解は一旦広がり始めると、発信力を持たない人が何を言っても止まりま

          FLMASK事件を思い出す