
パーリンノイズって何?ということで調べた話とDeforumでの設定
(wiki)
パーリンノイズ(英: Perlin noise)とは、コンピュータグラフィックスのリアリティを増すために使われるテクスチャ作成技法。擬似乱数的な見た目であるが、同時に細部のスケール感が一定である。このため制御が容易であり、各種スケールのパーリンノイズを数式に入力することで多彩なテクスチャを表現できる。パーリンノイズによるテクスチャは、CGIで自然な外観を物に与えるためによく使われる。
ちょっとこれだけでは意味が良く分からないですよね。素人には。
この記事は、Deforumで作成される映像の質の向上が見込まれる可能性があるパーリンノイズについて調べてみたので記事にしています。
Deforumのノイズの設定を見ると、このパーリンノイズの設定を変更することが出来ます。
その数値に関して詳細な記載がたまたま下の方のリンクサイトにありました。今回はそこで学んだ内容を主体に記載しています。
ちなみにDeforumのパーリンノイズの設定項目は「Persistence(持続性)」と「Octave(オクターブ)」ですね。
パーリンノイズを理解するための基本知識的なもの
パーリンノイズは、雲とか波とか不規則な形状を自然な感じに描写するのに使われたりするものの様です。
私なりの解釈なので、間違っているところがあるかもしれませんが、HPの図も合わせて順を追ってパーリンノイズについて勉強してみます。
自然界の雲の形をイメージすると分かりやすいと感じました。表面の構造はもわもわして不規則な感じですよね。
それを表現するために、ランダムにノイズを配置します。

そのノイズの間をなめらかに補完します。これが原型みたいな感じのようです。

「amplitude(振幅)」「frequency(頻度)」
パーリンノイズの調整に関しては、「amplitude(振幅)」「frequency(頻度)」という概念を理解しておくと良いようです。
綺麗なサイン波で見ると、amplitude(振幅)はその高さ、frequency(頻度)は、波の幅の逆数という定義の様です。

この2つの数値に着目すると、ノイズ波のamplitude(振幅)とfrequency(頻度)を調整することで、大まかな波形の雰囲気が出来る様です。
振幅が高く、頻度が低い ⇒ なだらかな大きい山っぽい

振幅と頻度が中程度 ⇒ でこぼこが目立つ

振幅が小さく、頻度が高い

これら「振幅」「頻度」のいくつかの組み合わせで出来た波を良い感じに足し合わせたのがパーリンノイズの様です。
このパーリンノイズの形を調整するものが、deforumの設定項目である「Persistence(持続性)」と「Octave(オクターブ)」の2項目になります。
「Persistence(持続性)」についてです。
この数値によって、「振幅」と「頻度」が決まり、波形が作製されるようです。
下はサイトの図を改変したものです。
持続性の値によって、出来上がる波の形が違うことが分かります。

「Octave(オクターブ)」についてです。
オクターブは低い音と高い音を比較すると2倍の周波数を持っていると意味を調べると出てきました。
オクターブの値を上げると、上の持続性で決定した波が重ね合わせられて、強調することが可能になるようです。
ということで、これらの結果をまとめると、
一般的に、オクターブ数を増やすと、より小さいスケールの詳細が増え、ノイズがより複雑になります。持続性が高いほど、細かい特徴がより強調されます。
どういう設定が良いの?
GPTさんの解説は以下です。
山脈や丘などの地形 オクターブ:4~6、持続性:0.4~0.6
オクターブが高く、持続性が低い組み合わせは、岩や石のような小規模な特徴を生み出すのに有効です。
雲や雲層 オクターブ:2~4、持続性:0.5
雲のフワフワとした外観と軽やかさを再現するのに役立ちます。
火炎 オクターブ:2~3、持続性:0.3~0.7
火炎を再現する際は、通常、持続性を調整し、不規則な動きと変化を表現します。
じゃあ人物は?
パーリンノイズを使用した人物表現に関する具体的な数値のガイドラインは広く公開されていないため、それぞれのプロジェクトや目的に合わせて実験的に最適な設定を見つけるプロセスが重要ですとのこと。
また、アニメ調と実写系でも調整の仕方が違うようです。
以下、GPTさんに無理矢理出してもらった推奨の数値
アニメ調の人物イラスト オクターブ:1-3、持続性:0.3~0.6
オクターブ: アニメ調のイラストでは、大きな形状と簡略化されたディテールが特徴です。低いオクターブ設定を使用すると、より滑らかで単純なテクスチャが生成され、このスタイルに合致します。
持続性: 持続性を低くすると、細かいディテールが減少し、イラストの大胆な線と形状が強調されますが、ある程度の持続性があると自然な感じの変化を加えることができます。
実写の人物 オクターブ:4-6、持続性:0.5-0.7
オクターブ: 実写風のテクスチャでは、肌、髪、衣服の微妙なディテールが重要です。より多くのオクターブを使用することで、これらの細かいテクスチャや陰影を捉えることができます。
持続性: 持続性を高めに設定すると、細かいディテールがより強調され、リアリズムが増します。しかし、あまりに高すぎると不自然に見えることがあるため、バランスが重要です。
ちなみにDeforumだと、オクターブは1-7、持続性は0-1の間で設定できます。

実写系モデルで試してみました。
設定しているノイズの値などとの関連もあるかと思いますが、持続性が低いと細かい書き込みが減少しやすい傾向にありました。
個人的に試してみた感じだと、GPTさんの推奨している範囲で良さげな感じに見えました。
オクターブ 5 持続性 0.6

オクターブ 6 持続性 0.5

別々のモデルを使用しています.。変化時の変化はプロンプトの干渉による影響と思われます。
ということで、パーリンノイズの設定についてでした。参考になればと思います。
あと、これらを書き終えた後にdeforum本家の解説にパーリンノイズについても記載がありました。