見出し画像

複素解析の寄り道(ウィルティンガー微分/複素偏微分)②

 複素解析の”寄り道”ということで、

複素解析にまつわるコラム(全3回)

の投稿を予定しています。今回は記念すべき第2回です。

 各記事はおおむね独立した内容なので、個別に読めます。
第1回→複素解析の寄り道(コーシー・リーマンの方程式)①

 履修者・既習者問わず、復習がてらのコーヒーブレイクにピッタリな内容です。是非お付き合いください☕

(PR)

複素数でも微分がしたい!

 複素数 𝑧 = 𝑥+i𝑦 を用いた

𝑧𝑧* =  𝑥²+𝑦²

※ただし、 ・* は複素共役を表す。

という表現には、素朴ながらとても奇妙な話があります。

 右辺( 𝑓(𝑥, 𝑦) = 𝑥²+𝑦² )で解析するならば、 ∇𝑓 = 0 となる原点で 𝑓 が極小だと解析できますが、左辺( 𝑓(𝑧) = 𝑧𝑧* )では d𝑓/d𝑧 = 0 を使おうにも、そもそも常微分 d𝑓/d𝑧 が不定なので使えません

( 𝑥²+𝑦² は下に凸なので、
この場合、原点で最小値)

 一般に、 𝑓 : ℂ→ ℝ は正則関数で、

  • 式に z* をふくみ、 d𝑧*/d𝑧 が不定項として邪魔をする。

  • ℂ≌ℝ² で 𝑓 は2次元から1次元へ押しつぶす変換である。

……などの要因から、先の例と同様に常微分 d𝑓/d𝑧 が定まらないのだと考えてよいです。

 この、 𝑓 : ℂ→ ℝ が

「”複素数のまま”で微分ができない」

という事実は、工学の方面にとっては非常に不便です。オイラーの公式 eⁱᶿ = cos𝛳+i sin𝛳 に代表される複素表現には

  • 電気信号などで頻出する波の表現である

  • 微分計算に適した簡潔な表現である

  • 三角関数の加法定理は指数法則で完結する

👆加法定理からの”解放”が一番ヤバイ

というようなやくがありますが、

「 𝑓(𝑧) ∈ℝが最小となる
引数 𝑧 を求める問題」

において、

𝑓(𝑧) = 𝑧𝑧* = (𝑥+i𝑦)(𝑥-i𝑦) = 𝑥²+𝑦² = 𝑓(𝑥, 𝑦)

……と、イチイチ複素数を実部・虚部へ分解して書き下すのは、式が複雑になればなるほど、正直言ってやってられないわけです。

 つまりは、

(→サムネイルの元ネタ

と思うのはとても自然なことなのです(感動のタイトル回収)。

▶ウィルティンガー微分(複素偏微分)


 ウィルティンガー微分は、「”複素数のまま”での微分」を叶え、

∂𝑓/∂𝑧 := 1/2 (∂𝑓/∂𝑥 -i ∂𝑓/∂𝑦)
∂𝑓/∂𝑧* := 1/2 (∂𝑓/∂𝑥 +i ∂𝑓/∂𝑦)

※符号の差異に注意せよ。

定義されるものです。ここでは、それぞれ z-偏微分 ∂𝑓/∂𝑧 、z*-偏微分 ∂𝑓/∂𝑧* と呼ぶことにします。

 なぜ ∂𝑓/∂𝑧 と ∂𝑓/∂𝑧* の2種類が登場したのでしょう? それは前回と近しい発想である

「関数 𝑓 を《実》から解釈( 𝑓(𝑥, 𝑦) )して、
《虚》として再解釈( 𝑓(𝑧, 𝑧*) )する過程」

によって得られた定義式だからなのです。

 作り方は至ってシンプルで、以下の材料

  • $${\newcommand{\d}{\mathrm{d}}\d z=\d x+i\d y, \,\d z^*=\d x-i\d y}$$

  • $${\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}\d f=\dfrac{\p f}{\p x}\d x+\dfrac{\p f}{\p y}\d y}$$

※全微分可能性などを仮定しています。

を、$${\mathop{\text{Re}}[z]\coloneqq\dfrac{z+z^*}{2}\equiv x,\, \mathop{\text{Im}}[z]\coloneqq\dfrac{z-z^*}{2 i}\equiv y}$$であることに注意して代入・展開を行い、最後にd𝑧, d𝑧*について形を整えると完成します:

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
\begin{align*}
\d f
&=\dfrac{\p f}{\p x}\d x+\dfrac{\p f}{\p y}\d y\\
&=\dfrac{\p f}{\p x}\left(\dfrac{\d z+\d z^*}{2}\right)+\dfrac{\p f}{\p y}\left(\dfrac{\d z-\d z^*}{2i}\right)\\
&=\dfrac{\p f}{\p x}\left(\dfrac{\d z+\d z^*}{2}\right)+\dfrac{\p f}{\p y}\left(\dfrac{\d z-\d z^*}{2i}\right)\\
&=\dfrac{1}{2}\left(\dfrac{\p f}{\p x}+\dfrac{1}{i}\dfrac{\p f}{\p y}\right)\d z+\dfrac{1}{2}\left(\dfrac{\p f}{\p x}-\dfrac{1}{i}\dfrac{\p f}{\p y}\right)\d z^*\\
&=:\dfrac{\p f}{\p z}\d z+\dfrac{\p f}{\p z^*}\d z^*
\end{align*}
$$

 この過程から、関数 𝑓 を”複素関数”として観る場合、

 𝑓(𝑧) と表現するのではなく、
本来は 𝑓(𝑧, 𝑧*) と2変数の形で
表現される方が適切である

と言えるのです。

 ちなみに ∂𝑓/∂𝑧, ∂𝑓/∂𝑧* の定義における符号の差異は、𝑧 = 𝑥+i𝑦 かつ 1/i = -i であることに注意すると、間違えることは少ないでしょう:

$$
\newcommand{\p}{\partial}
\dfrac{\p f}{\p z} \coloneqq \dfrac{1}{2}\left(\dfrac{\p f}{\p x}-i\dfrac{\p f}{\p y}\right)=\dfrac{1}{2}\underbrace{\left(\dfrac{\p f}{\p x}+\dfrac{1}{+i}\dfrac{\p f}{\p y}\right)}_{\text{\bf cf. }z=x+iy}\\[7.0pt]
\dfrac{\p f}{\p z^*} \coloneqq \dfrac{1}{2}\left(\dfrac{\p f}{\p x}+i\dfrac{\p f}{\p y}\right)=\dfrac{1}{2}\underbrace{\left(\dfrac{\p f}{\p x}+\dfrac{1}{-i}\dfrac{\p f}{\p y}\right)}_{\text{\bf cf. }z^*=x-iy}
$$

▶停留点を見つけ出せ!


 さて、全微分 d𝑓 が複素引数 (𝑧, 𝑧*) で得られれば、勾配場 ∇𝑓 も複素引数 (𝑧, 𝑧*) で与えられます

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
  \\[-10pt]
\begin{align*}
\d f
&=\dfrac{\p f}{\p z}\d z+\dfrac{\p f}{\p z^*}\d z^*\\
&\equiv\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p z}\\[8.0pt]\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p z^*}\end{pmatrix}\cdot\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\d z\\[8.0pt]\rule[-10pt]{0pt}{25pt}\d z^*\end{pmatrix}\\
&=\nabla f(\bm \gamma)\cdot\d\bm\gamma
\end{align*}\\[7.0pt]
\begin{cases}
\:\:\cdot\:\hspace{-5pt}&:\texttt{点乗積(内積)}
\end{cases}
$$

 では実際に、冒頭で扱った

𝑧𝑧* =  𝑥²+𝑦²

※ただし、 ・* は複素共役を表す。

停留点( ∇𝑓 = 0 を満たす引数)を求めていきましょう。

(PR)

▶ ∇𝑓(𝑟) (𝑟 = (x, y)) の確認


 まず、$${\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}\d f=\dfrac{\p f}{\p x}\d x+\dfrac{\p f}{\p y}\d y}$$から得られる勾配場 ∇𝑓(𝑟) で求める方法を確認します。

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
\d f=\nabla f(\bm r)\cdot \d \bm r
$$

 復習として、 ∇𝑓(𝑟) は「各点で 𝑓 が最も増加する方向」を向いています。増分 Δ𝑓 = ∇𝑓(𝑟)・Δ𝑟 = |∇𝑓(𝑟)| |Δ𝑟| cosθ が最大となるのは、「 Δ𝑟 が ∇𝑓(𝑟) と同じ向き(θ=0)であるとき」であり、逆説的に言えば ∇𝑓(𝑟) は「各点で 𝑓 が最も増加する方向を指す」と言えるのでした:

(角度以外のパラメータは固定)

 「 ∇𝑓 = 0 」とは、言い換えれば「増分 Δ𝑓 がゼロ(停留)」であり、グラフ上では「 ∇𝑓 = 0 を満たす点(停留点)で 𝑓 は平地である」と言えます。つまり、停留点は極大・極小(最大・最小)を与える可能性のある候補地として重要です。

 本題へ戻り、 ∇𝑓(𝑟) の定義から

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
\nabla f(\bm r)\coloneqq\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p x}\\[8.0pt]\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p y}\end{pmatrix}
=\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\dfrac{\p}{\p x}(x^2+y^2)\\[8.0pt]\rule[-10pt]{0pt}{25pt}\dfrac{\p}{\p y}(x^2+y^2)\end{pmatrix}
=\begin{pmatrix}\rule[-10pt]{0pt}{25pt}2x\\[8.0pt]\rule[-10pt]{0pt}{25pt}2y\end{pmatrix}\\
$$

であり、 ∇𝑓(𝑟) = 0 を満たす点は原点(𝑥=𝑦=0)しか在り得ないと分かります。

( 𝑥²+𝑦² は下に凸なので、
この場合、原点で最小値)

※再掲

▶ ∇𝑓(𝛾) を定義から計算


 では次に定義から ∇𝑓(𝛾) を計算してみましょう。すぐに分かることですが、多くの場合2度手間となります。

 定義より、

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}

\nabla f(\bm \gamma)\coloneqq\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p z}\\[8.0pt]\rule[-10pt]{0pt}{25pt}\dfrac{\p f}{\p z^*}\end{pmatrix}\\
\begin{align*}
&=\dfrac{1}{2}\begin{pmatrix}\rule[-10pt]{0pt}{25pt}\dfrac{\p}{\p x}(x^2+y^2)+\dfrac{1}{\underset{\bm\sim\hspace{-1.8pt}\bm\sim}{+}i}\dfrac{\p}{\p y}(x^2+y^2)\\[8.0pt]\rule[-10pt]{0pt}{25pt}\dfrac{\p}{\p x}(x^2+y^2)+\dfrac{1}{\underset{\bm\sim\hspace{-1.8pt}\bm\sim}{-}i}\dfrac{\p}{\p y}(x^2+y^2)\end{pmatrix}\\
&=\dfrac{1}{2}\begin{pmatrix}\rule[-10pt]{0pt}{25pt}2x+\dfrac{1}{+i}2y\\[8.0pt]\rule[-10pt]{0pt}{25pt}2x+\dfrac{1}{-i}2y\end{pmatrix}
=\begin{pmatrix}\rule[-10pt]{0pt}{25pt}z^*\\[8.0pt]\rule[-10pt]{0pt}{25pt}z\end{pmatrix}\\
\end{align*}
$$

であるため、∇𝑓(𝛾) = 0 を満たす点は ∇𝑓(𝑟) = 0 の結果と同様に、原点(𝑧=0)しか在り得ないと分かります。

▶ 形式的な計算


 ここで、通常の偏微分と同様に 𝑧 と 𝑧* を異なる独立変数として計算してみます。

 便べん的に 𝑧 → α, 𝑧* → β と文字を置き換えます。すると、 𝑓(𝑧, 𝑧*) = 𝑧𝑧* → 𝑓(α, β) = αβ となり、∂𝑓/∂α, ∂𝑓/∂β が考えられます。

 これにより、

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
\dfrac{\p}{\p\alpha}(\alpha\beta)=\beta,\,\dfrac{\p}{\p\beta}(\alpha\beta)=\alpha\\
$$

であり、元に戻せば、

$$
\newcommand{\d}{\mathrm{d}}\newcommand{\p}{\partial}
\dfrac{\p}{\p z}(zz^*)=z^*,\,\dfrac{\p}{\p z^*}(zz^*)=z\\[7.0pt]
\begin{cases}
\:\texttt{\bf cf.\:}\nabla f(\bm\gamma)=\begin{pmatrix}\rule[-10pt]{0pt}{25pt}z^*\\[8.0pt]\rule[-10pt]{0pt}{25pt}z\end{pmatrix}
\end{cases}
$$

となって先の結果と見事一致します。

 ウィルティンガー微分(複素偏微分)は確かに「”複素数のまま”での微分」を叶えてくれそうですが、数学的な正当性(裏付け)はまだまだ先の話になります。

(PR)

むすび🧵


 本記事は前回に引き続いて「𝑧𝑧* = 𝑥²+𝑦²」から生まれる複素偏微分を考える動機とその発想について触れてきました。

 その際、全微分 d𝑓 を足掛かりとして定義を与え、 ∇𝑓(𝑟) = 0 及び ∇𝑓(𝛾) = 0 となる停留点 𝑟, 𝛾 を求めました。最後には形式的な計算結果と一致することを確かめ、「”複素数のまま”での微分」が微かに分かって頂けたかと思います。

 次回(最終回)は

複素数ℂを係数体ℝの世界で
可視化するお話(第3回

を予定しています。お楽しみに。

おまけ

Google図形で作り始めて後悔……orz)

Back to Section ↺


※本記事はAmazonのアソシエイトとして
商品の紹介及び上記URLを使用しています。

いいなと思ったら応援しよう!

Keshitan@数学記事
最後までお読み頂き、誠にありがとうございます。記事の内容にご満足頂けましたら、是非ともサポートのご検討をお願いしたく思います! もしご支援頂ければ、細々と書き綴るnote活動に豊かさが生まれます。頂きました支援金は、存続のための活動資金として大切にお使いしたく思います。