見出し画像

【初心者向け】ボルドーワインの価格を方程式を使って求めてみた

実は世の中には、ボルドーワインの価格をワインを一滴も飲まず求めることができるのです。それがこの「アッシェンフェルターのワイン方程式」というものです。

ボルドーワインの価格予想方程式

log(e)(当年のワインの平均価格/1961年物のビンテージの平均価格) = 
-12.145
+ 0.00117 ×冬の降雨量
+ 0.614 ×育成期平均気温
- 0.00386 ×収穫期降雨量
+ 0.0239 ×1983年基準でのワインの熟成年数

この方程式は一見「難しそう、、、、」と思う方もいらっしゃるかもしれませんが、全く難しいものではありません。以下、式の説明を小学生でもわかるレベルで噛み砕いて紹介します。

  1. 冬の降雨量(ワインの原料となる葡萄の)とワインの価格には正の相関があります。言い換えると、収穫前年の10月〜3月に雨が降れば降るほどワインの価格は上がります。

  2. 育成期平均気温(4月〜9月の平均気温)とワインの価格には正の相関があります。言い換えると、4月〜9月の平均気温が高いほどワインの価格は上がります。

  3. 収穫期降雨量(8月9月の降雨量)とワインの価格には負の相関があります。言い換えると、8月9月に雨が降れば降るほどワインの価格は下がります。

  4. 1983年基準でのワインの熟成年数と価格には正の相関があります。言い換えると、ワインの年代が古くなればなるほどワインの価格は上がります。

この数式は、統計的にきちんと証明されたものですが、ワインの専門家たちからは相当非難されたようです。
それもそうです。「ワインの試飲なんかしなくてもワインの品質が分かる」といっているようなものですから、専門家たちが非難する気持ちも分からないことはありません。
(ちなみにこの方程式を導き出したアッシェンフェルターは大のワイン好きです)

実際にどのように方程式を見つけたのか

①2変数の相関を見つける

相関関係って覚えていますか?中学校と高校で習うアレです。ちょっと怪しい方がいるかもしれないので、少しだけ相関関係の説明をしますね。「もう知ってるわ」って方は飛ばしてください。

アイスコーヒーとホットコーヒーを比較したときに、アイスコーヒーは1日の平均気温が高い(暑い)ほど販売個数が多くなりますよね。しかし、ホットコーヒーは逆に1日の平均気温が低い(寒い)ほど販売個数が多くなります。これをグラフ化すると上のようになるのですが、これが相関を表した散布図ってやつです。

この散布図で左側の「右肩上がりになってるやつ」
要は「平均気温(変数)が上がれば上がるほど、アイスコーヒーの販売個数(変数)も上がる」やつのことを正の相関と表現します。
一方で、「右肩下がりになってるやつ」
つまり「平均気温(変数)が上がれば上がるほど、ホットコーヒー販売個数(変数)が下がる」やつのことを負の相関という表現をするのです。

ちなみに、これを数値化した相関係数というものがあって、「-1」に近いほど負の相関があり、「+1」に近いほど正の相関があることになります。

さて、本題に戻りましょう。
今回やりたいのは、あくまでもボルドーワインの価格を求めるために2変数の相関を見つけることです。

まず、上記の方程式を見て分かるように、この式を編み出したアッシェンフェルターは過去の天候データを大量に収集したようです。とは言っても、すでに私たちは方程式の結果を知っているので使うデータの"種類”はそれほど多くないことを知っています。使うデータは、

  • フランスのボルドー降雨量データ

  • フランスのボルドー平均気温データ

  • ボルドーワインの熟成年数

以上です。

これらの変数のデータを使って、相関がどれほど強いのかを調べていきます。
一般的に相関係数が±0.7を超えてくると強い相関とみなします。

おそらくアッシェンフェルターは上記の3つ以外にもかなり多くのデータを使ってワインの価格と相関関係があるのか調べたのだと思いますが、最終的に上記3つの変数がワインの価格と強い相関を表し、ワインの価格がフランスボルドーの天候さえわかれば導き出せることを突き止めたようです。

さて、相関が強いものを突き止めることはできましたが、これではまだ価格を求算出することはできていません。
そこで、価格を算出するためにそれぞれの変数が実際の価格に対してどれくらいの影響力を持っているのかを数値化する必要があるのです。

②それぞれの変数の影響力を数値化

専門用語で「回帰分析(かいきぶんせき)」と言ったりします。要は見出しにもある通り、それぞれの変数の影響力を数値化します。(ちなみに変数が3つ以上の場合の回帰分析を特に重回帰分析(じゅうかいきぶんせき)と言います。)(厳密に言うと影響力とは少し性質が異なるのですが、今回は省略します)

重回帰分析では目的変数と説明変数の2つの変数を考えることがかなり大切になってきます。上記の画像のように、「家賃」という目的変数は、「駅からの距離」「部屋の広さ」「築年数」の3つの説明変数標準偏回帰係数分だけ影響を与えて算出することができるというように考えるのが重回帰分析の基本的な考え方です。

今回のボルドーワインで同様のことを考えると下のようになります。

さて、ここからこれを読んでくださっている皆さんが一番気になっているであろう標準偏回帰係数なのですが、これは説明が少しだけマニアックになります。なので「標準偏回帰係数が気になって眠れないよ!!!!!!」という人だけこの章の残りの部分を読んでください。(ちなみに値の算出自体はExcelなんかで簡単にできます)

標準偏回帰係数は最小二乗法という考え方を使って求めることができます。

上記の図は2変数の場合なのですが、これが3変数以上になってくると次元が上がるので、もはや図示できなくなります。
(次元ってのはドラえもんの4次元ポケットなんかの「次元」と同じやつです)

この最小二乗法を使うことで回帰直線(目的変数を説明するための方程式)を求めることができ、自然と標準偏回帰係数も決まるのです。
文章だけでは説明しづらいので、詳しい求め方は最後に動画で紹介しました。

方程式を実際に実際に当てはめてみる

log(e)(当年のワインの平均価格/1961年物のビンテージの平均価格) =
-12.145
+ 0.00117 ×冬の降雨量
+ 0.614 ×育成期平均気温
- 0.00386 ×収穫期降雨量
+ 0.0239 ×1983年基準でのワインの熟成年数

さて、やっとの思いで説明できたボルドーワインの価格予想方程式ですが、ここからは実際に当てはめてみて2023年のボルドーワインの価格を予想してみたいと思います。

❶データを集める

計算するにあたって必要な、

  • フランスのボルドー降雨量データ

  • フランスのボルドー平均気温データ

  • ボルドーワインの熟成年数

のうち上記2つに関してはこちらのサイトから拝借しました。

分かったことは、
冬の降雨量 = 96mm
育成期平均気温 = 20℃
収穫期降雨量 = 49mm

ということです。

またボルドーワインの熟成年数に関しては、1983年を基準に考えるので「−40年」になります。

あと、もう1つ必要なデータがあります。
それは「1961年物のビンテージボルドーワインの平均価格」です。

こればっかりはどこを調べてもなかなか出てこなかったので、
とりあえず、ChatGPTに聞きました。

❷分からないことはAIに相談

そうだよねそんな気はしてた

結果は惨敗です。
こんなことではへこたれません。僕らの味方はChatGPTだけではありません。Copilot(Microsoftのやつ)もいます。

最近はCopilotを愛用しています

さすがの回答です。
でも、幅がありすぎてよく分からないので今回は1961年のボルドーワインの平均価格を「500ユーロ(81,090円)」(1ユーロ=162.18円換算)とします。
(ボルドーワイン詳しい方いらしたら、ぜひ教えてください)

❸いよいよ算出する

さて、材料は揃いました。
これらを使って2023年のボルドーワインの価格予想をしたいと思います。

出ました。
「-0.89782」となりました。
これが「log(e)(当年のワインの平均価格/1961年物のビンテージの平均価格)」になります。

さて、これに先ほど仮定しておいた1961年のボルドーワインの平均価格500ユーロを使うと計算は次のようになります。

日本円だと3万3000円程度。
1961年のボルドーワインの評価はかなり高かったとはいえ、500ユーロ(81,090円)と比べるとかなり低い結果に、、、。

方程式を見てみると、育成期の平均気温がかなり金額に影響を与えているようです。ちなみに上記の方程式で育成期平均気温を「20℃→21℃」に変えてみるだけで、一気に価格が2倍近くに上がります。

育成期の平均気温、かなり大事なんですね、、、!

【おまけ】方程式の算出方法が気になってしょうがない方へ

動画でボルドーワインの価格予想方程式の算出方法を紹介したいと思います。超簡単なので実際に手を動かしてやってみてください。

偏愛とマーケティング研究所について

偏愛とマーケティング研究所では、データの集め方、現場で活用できるデータ分析の方法を紹介しています。
「データを活用したいけど、何をしていいのか分からない」
なんて方はお気軽にご連絡ください。

著者: 納富 崇 / NOTOMI Takashi (Twitter: @takashi_notomi)

偏愛とマーケティング研究所 代表 / データサイエンティスト



いいなと思ったら応援しよう!