ベクトルの内積に cosine が現れるのはなぜか
高校数学でベクトルについて学ぶ際に、ベクトル同士の足し算や引き算、ベクトルのスカラー倍あたりまでは図形的に分かりやすく、楽しく学ぶことができたのに、「内積」という謎の掛け算が出てきたところで急につまづいた、という経験のある人はいないでしょうか?
具体的には、二つのベクトル $${\bm{a} , \bm{b}}$$ に対して内積という掛け算を
$$
\bm{a} \cdot \bm{b} = | \bm{a} | | \bm{b} | \cos \theta
$$
と定義する、という記述がほとんどの教科書で唐突に出てきます。この式中の $${| \bm{a} | , | \bm{b} |}$$ はそれぞれベクトル $${\bm{a} , \bm{b}}$$ の大きさを表し、$${ \theta }$$ はベクトル $${\bm{a} , \bm{b}}$$ のなす角を表します。ベクトル同士の掛け算として、大きさ同士を掛け合わせる、というのは何となく理解できますが、なぜ $${ \cos \theta }$$ が掛かるのか、というところで引っかかる人は少なくないように思います。(私自身が昔そうでした。)この記事では、この「なぜ $${ \cos \theta }$$ が掛かるのか」という点を解説します。
余弦定理を使った説明
上の内積の式を説明するのに、余弦定理を使うのはよくある方法です。三辺の長さがそれぞれ $${ a, b, c }$$ で、長さ $${ c }$$ の辺に向かい合う角を $${ \theta }$$ とする三角形において、辺の長さ $${ c }$$ を求めることを考えます。
上図左において余弦定理を用いると
$$
c^2 = a^2 + b^2 - 2 a b \cos \theta
$$
となります。同時に、三角形の各辺を上図右のようにベクトルと見なして、左図の $${ c^2 }$$ に対応する $${ | \bm{a} - \bm{b} |^2 }$$ を求める式をつくると
$$
| \bm{a} - \bm{b} |^2 = ( \bm{a} - \bm{b} ) \cdot ( \bm{a} - \bm{b} )
= \bm{a} \cdot \bm{a} - \bm{a} \cdot \bm{b} - \bm{b} \cdot \bm{a} + \bm{b} \cdot \bm{b} \\\ \\\ = | \bm{a} |^2 + | \bm{b} |^2 - 2 \bm{a} \cdot \bm{b}
$$
となります。左図の辺の長さ $${ a, b }$$ は右図のベクトルの大きさ $${ | \bm{a} |, | \bm{b} | }$$ に対応するので、この二式を比較することにより、内積の式 $${ \bm{a} \cdot \bm{b} = | \bm{a} | | \bm{b} | \cos \theta }$$ が導けます。
この説明には釈然としない人(高校生)もいるかもしれません。なぜなら、余弦定理とベクトルの内積のどちらも高校の数学で学ぶことで、この二つが整合的であることは理解できるけれども、なぜ内積という掛け算をわざわざこのように定義するのか、その必然性があまりよく見えてこないからです。
ただ、そうであったとしても、角度 $${ \theta }$$ が $${ 90^{\circ} }$$ の場合に $${ \bm{a} \cdot \bm{b} = 0 }$$ となることは納得できるのではないでしょうか。この場合、余弦定理は中学の頃からおなじみの「三平方の定理」となるからです。次節では、この「直交する二つのベクトルの内積はゼロとなる」ことを基にした説明を述べます。
直交する二つのベクトルの内積がゼロとなることを使った説明
前節で三平方の定理から「直交する二つのベクトルの内積はゼロとなる」ことを述べましたが、ここでは別の方法でこのことを導きます。
大きさが等しく互いに平行ではない二つのベクトル $${ \bm{c} , \bm{d} }$$ を用意し、その始点をそろえたときに二つのベクトルがつくる平行四辺形を考えます。
ベクトル $${ \bm{c} , \bm{d} }$$ は大きさが等しいことから、この平行四辺形は「ひし形」です。そして「ひし形」の性質である「対角線が直交する」ことに注目します。この対角線に対応するベクトルは $${ \bm{c} + \bm{d} }$$ と $${ \bm{c} - \bm{d} }$$ ですが、この二つのベクトルの内積をつくると
$$
( \bm{c} + \bm{d} ) \cdot ( \bm{c} - \bm{d} )
= \bm{c} \cdot \bm{c} - \bm{c} \cdot \bm{d} + \bm{d} \cdot \bm{c} - \bm{d} \cdot \bm{d}
= | \bm{c} |^2 - | \bm{d} |^2
$$
となり、ベクトル $${ \bm{c} , \bm{d} }$$ は大きさが等しいことから、これはゼロとなることが分かります。ベクトル $${ \bm{c} + \bm{d} }$$ と $${ \bm{c} - \bm{d} }$$ は直交しているわけですから、「直交する二つのベクトルの内積はゼロとなる」ことが示されました。
次に、点 $${ \mathrm{O} }$$ を始点、点 $${ \mathrm{A, B} }$$ をそれぞれ終点とする二つのベクトル $${ \bm{a} , \bm{b} }$$ を考え、そのなす角度を $${ \theta }$$ とします。そして点 $${ \mathrm{A} }$$ から直線 $${ \mathrm{OB} }$$ に垂線をおろしてその足を $${ \mathrm{H} }$$ とします。
線分 $${ \mathrm{OH} }$$ の長さは $${ | \bm{a} | \cos \theta }$$ と表されるので、ベクトル $${ \bm{b} }$$ と同じ方向を向いているベクトル $${ \overrightarrow{ \mathrm{OH} } }$$ は
$$
\overrightarrow{ \mathrm{OH} }
= \frac{|\overrightarrow{ \mathrm{OH} }|}{|\overrightarrow{ \mathrm{OB} }|} \bm{b}
= \frac{ | \bm{a} | \cos \theta}{| \bm{b} |} \bm{b}
$$
と表され、これから
$$
\overrightarrow{ \mathrm{AH} } =
\overrightarrow{ \mathrm{OH} } - \overrightarrow{ \mathrm{OA} }
= \frac{ | \bm{a} | \cos \theta}{| \bm{b} |} \bm{b} - \bm{a}
$$
となります。ここで「直交する二つのベクトルの内積はゼロとなる」ことをベクトル $${ \bm{b} }$$ と $${ \overrightarrow{ \mathrm{AH} } }$$ に対して使うと
$$
\bm{b} \cdot \overrightarrow{ \mathrm{AH} }
= \frac{ | \bm{a} | \cos \theta}{| \bm{b} |} (\bm{b} \cdot \bm{b}) - \bm{a} \cdot \bm{b} = 0
$$
となって、内積の式 $${ \bm{a} \cdot \bm{b} = | \bm{a} | | \bm{b} | \cos \theta }$$ が導かれます。
「内積の性質」から考える
ここまでは図形的な考察により、内積の式を導くことをしてきましたが、表題の「なぜ cosine が現れるか」という問にあまり正面から答えていません。例えば、$${ \cos \theta }$$ が掛かっていない、大きさ同士だけの掛け算 $${ | \bm{a} | | \bm{b} | }$$ とか、$${ \cos \theta }$$ の代わりに $${ \sin \theta }$$ が掛かっているものとか、そういうものではなぜダメなのでしょうか。もちろん、そういったもので内積を定義すると、前節で述べた「直交する二つのベクトルの内積はゼロとなる」ということを満たしませんから、ダメであることは分かります。でも、内積という概念のどこの部分が効いて cosine が出てくるのでしょうか。
そのことを見るために、「内積の性質」に着目します。ここまであえて触れませんでしたが、前節・前々節で行った式変形の中で以下の「内積の性質」を使っています:
$${ \bm{a} \cdot \bm{b} = \bm{b} \cdot \bm{a} }$$ (交換法則)
$${ \bm{a} \cdot ( \bm{b} + \bm{c} ) = \bm{a} \cdot \bm{b} + \bm{a} \cdot \bm{c} }$$ (分配法則)
$${ ( k \bm{a} ) \cdot \bm{b} = \bm{a} \cdot ( k \bm{b} ) = k ( \bm{a} \cdot \bm{b} ) }$$ ($${ k }$$ はスカラー)
$${ \bm{a} \cdot \bm{a} = | \bm{a} |^2 }$$
交換法則や分配法則は普通の数の掛け算と同様に成り立つので、思わず素通りしてしまいそうになりますが、これらをよく見ることは「なぜ cosine が現れるか」を考える上で役に立ちます。例えば、内積を大きさ同士の掛け算 $${ | \bm{a} | | \bm{b} | }$$ で定義してしまうと、上記の 1. と 4. は満たしますが、2.(分配法則)が成り立たなくなってしまいます。もし 1. ~ 4. を全て満たそうとすると、前節や前々節で行った図形的な考察により、必然的に cosine が現れるのです。
(2023年 7月17日 追記)
仮に内積を大きさ同士の掛け算 $${ | \bm{a} | | \bm{b} | }$$ で定義したとすると、2.(分配法則)の左辺は $${ | \bm{a} | | \bm{b} + \bm{c} | }$$, 右辺は $${ | \bm{a} | \left( | \bm{b} | + | \bm{c} | \right) }$$ となりますが、これは三角不等式
$$
\left | \bm{b} + \bm{c} \right | \le | \bm{b} | + | \bm{c} |
$$
により、$${ \bm{b} , \bm{c} }$$ がいずれも $${ \bm{0} }$$ でなく、かつ $${ \bm{b} }$$ と $${ \bm{c} }$$ が平行でない限り、等しくなることはありません。なす角の cosine が入った正しい定義を念頭におきつつ、例えば下図のような状況を考えます:
ベクトル $${ \bm{a} }$$ と $${ \bm{b} , \bm{c} , \bm{b}+\bm{c} }$$ がそれぞれなす角を $${ \theta_1 , \theta_2 , \theta }$$ とすると、上図から
$$
\left | \bm{b} + \bm{c} \right | \cos \theta = | \bm{b} | \cos \theta_1 + | \bm{c} | \cos \theta_2
$$
となることが分かり、この式の両辺に $${ | \bm{a} | }$$ を掛ければ、2.(分配法則)が成り立つことが示されます。
ほとんどの教科書では、まず内積を $${ \bm{a} \cdot \bm{b} = | \bm{a} | | \bm{b} | \cos \theta }$$ で定義し、その後で内積の性質について述べています。しかし、その書き方だと「なぜそのように定義するのか」というのが見えにくく、「なぜ $${ \cos \theta }$$ が掛かるのか」というような疑問を持たれやすいのではないかと思います。順序を逆にして、内積を「ベクトル同士の掛け算として上記の『内積の性質』を満たすもの」として定義し、図形的な考察をすると結果的に $${ \bm{a} \cdot \bm{b} = | \bm{a} | | \bm{b} | \cos \theta }$$ となる、と考えたほうが混乱が少ないように思います。
一般化されたベクトルでの内積
ここで、大学レベルの数学の話を少しだけします。大学の「線形代数」等の科目では、高校の数学で学んだベクトルを一般化することを学びます。そのような一般化をすると、例えばある種の条件を満たす関数もベクトルと見なせるようになるなど、見方を広げることができます。高校の数学で学ぶ図形的なベクトル(幾何ベクトルと呼ばれます)は、一般化されたベクトルのある特別な場合となるわけです。
一般化されたベクトルに対しても内積を定義することができます。ただ、その定義の仕方は高校数学で学んだものとは少し様相が違います。それは、一般化された二つのベクトル $${ \bm{x} , \bm{y} }$$ から計算して一つのスカラーを出すようなもので、$${ \bm{x} \cdot \bm{y} }$$, $${ ( \bm{x} , \bm{y} ) }$$, $${ \langle \bm{x} , \bm{y} \rangle }$$ 等と表します。ここでは $${ \langle \bm{x} , \bm{y} \rangle }$$ と表すことにします。そして、それは以下のような性質を満たすものとして定義します:
$${ \langle \bm{x} , \bm{y} \rangle = \langle \bm{y} , \bm{x} \rangle }$$ (交換法則)
$${ \langle \bm{x} , \bm{y}_1 + \bm{y}_2 \rangle = \langle \bm{x} , \bm{y}_1 \rangle + \langle \bm{x} , \bm{y}_2 \rangle}$$ (分配法則)
$${ \langle k \bm{x} , \bm{y} \rangle = \langle \bm{x} , k \bm{y} \rangle = k \langle \bm{x} , \bm{y} \rangle }$$ ($${ k }$$ はスカラー)
$${ \langle \bm{x} , \bm{x} \rangle \ge 0 }$$ で $${ \langle \bm{x} , \bm{x} \rangle = 0 }$$ となるのは $${ \bm{x} = 0 }$$ のときに限る
この性質は、前節で述べた、幾何ベクトルに対する内積の性質を一般化したものと見なせます。ただし、幾何ベクトルに対する内積の性質の 4. つまり $${ \bm{a} \cdot \bm{a} = | \bm{a} |^2 }$$ だけ異質です。それ以外の性質は全て内積だけを使って表されているのに、これだけは内積以外に「ベクトルの大きさ」$${ | \bm{a} | }$$ という別に定義される量が出てきているからです。
注意してほしいのは、$${ \bm{a} \cdot \bm{a} = | \bm{a} |^2 }$$ という式を、「同じもの同士の掛け算だから、まとめて二乗と書いたもの」などと思ってはいけません。(高校生の頃の私は、そのように安直に考えていました。)内積と大きさは本来無関係です。
「ベクトルの大きさ」というのは、一般化されたベクトルの場合は「ノルム」と呼ばれ、$${ \| \bm{x} \| }$$ 等と表されますが、これは本来内積とは無関係な量です。ただし、ノルムの定義として内積を使って
$$
\| \bm{x} \| = \sqrt{ \langle \bm{x}, \bm{x} \rangle }
$$
とすることは可能で、これを「内積から誘導されたノルム」といいます。つまり、幾何ベクトルに対する内積の性質の 4. は、幾何ベクトルの場合のノルム(大きさ)は内積によって誘導される、ということを言っている式です。
ベクトルというのは、実は非常に広い概念で、その中でベクトル同士の掛け算として自然な形で一般的に定義された内積というものがあり、それを高校数学で学ぶ幾何ベクトルに当てはめると、これまで述べてきたようにして必然的に cosine が現れる、ということになります。以上、お分かりいただけたでしょうか。この記事が皆さんの理解の助けとなれば幸いです。