バヌアツの法則をコードインタープリター で確かめてみる
「バヌアツの法則」を調べてみたい
バヌアツの法則をご存じでしょうか?
2023年の5月にトンガで大きな地震があり、その直後に千葉でも大き目の地震があったことから、ネットでも少し騒ぎになったようで、私は、このときにはじめて知りました。
科学的な法則として認められているようなものではなく、ネットで長期間囁かれ続けているという代物なので、正確な定義といったものはないんですが、「防災新聞」というサイトには、以下のように書かれていました。
日本で大きな地震が起きたときには、その前に、バヌアツでも大きな地震が起きていることが多いみたいで、『防災新聞』でもこんな事をいっています。
バヌアツは地震の頻発国のため、日本で地震が起きる直前に、たまたま大きな地震が起こっていても別におかしくありません。このため、データとしての裏付けもイマイチとみられているようです。
もちろん、地震の専門家からは論外扱いのようで、FNNのニュースに出演した東大地震研の古村教授は、こんな風に語っています。
しかし、本当に偶然なのか、どうもスッキリしませんね。
そこで、バヌアツでM6以上の地震が起こってから2週間以内に日本でM6以上の地震が起きる頻度は、日本でM6以上の地震が起きる平均的な頻度より高いのか、をデータから直接導き出してみたいと考えました。
こういうときに、ChatGPTのコードインタープリターは強力な助っ人になるはずです。
というか、コードインタープリターを試してみたくて、ネタを考えてみたという感じではあるんですが…。
コードインタープリターって何?
コードインタープリターは、OpenAI社が開発した、ChatGPTの拡張機能です。
人間がChatGPTに指示を与えると、指示に基づいてPythonのプログラムを作成し、そのプログラムでデータを処理して、結果を教えてくれるというものです。
ChatGPTは、基本的に言語モデルで、人間なら「いいそうな事」を適当に答えちゃうので、正確な答えを求めるには使えないものでした。また、計算に弱いこともよく知られています(本当に計算しているわけではないので)。
コードインタープリターを使えば、プログラムを作るのはChatGPTですが、実際にデータを処理するのはプログラムなので、それらしい事を適当に答えちゃう、といった事がありません。
A.I.の能力を本格的にデータ分析にも使えるという、真にゲームチェンジャーになりそうなスゴイ機能です。
使ってみてどうだった?。
データを見て欠損値があるときには、その処理を提案してくれたりとか、至れりつくせりです。また、国名を抽出したいといった処理をするときも、ChatGPT手持ちの国名リストとかをサクッと出してくるので、大変便利でした。
ただ、やはり変な処理をする事はあるので、吐き出されたコードを確認するのは必須だと思います。ざっくりとこんな感じで、でももちろんやってくれますが、やらせたい事が明確な場合は、ある程度、ステップ分けして教えてあげた方が良い感じです。
一番問題なのは、ChatGPT上に確保される仮想マシンが、割と早くリセットされちゃうところですね。なんか、お茶飲んだりしていると、リセットされちゃう感じです。
また、一回チャットを離れて、別のチャットに行っている間にもリセットされてしままいました。この時は、描画したグラフとかも消えてしまって焦りました。表示したグラフは、その場でコピペして保存が原則ですね。
再計算しようとして、最初の質問の「修正・再送信ボタン」を押してみたら、以降の計算がすべてリセットされてしまった事もありました。これも要注意ですね。
コードの確認は必要。
段取りが分かっていれば、なるべくステップバイステップで指示した方が良い。
仮想マシンのリセットには要注意。
中間データや、出力したグラフはこまめに保存
さかのぼって「修正・再送信」はやらない方が良い。
バヌアツの法則を聞いてみる
データとしてはUSGS(アメリカ地質調査所)が、インターネットで公開しているデータを用いました。期間としては2003年からの20年間。マグニチュードが6以上のデータに絞って取得しています。
このデータを、ChatGPTにアップロードした上、以下の質問(というか命令)をなげかけてみました。
ちなみに、質問では、2003年から2003年という間違った事を伝えていますが、ChatGPTはちゃんと2023年までに修正して計算していました(有能)。
結果のグラフはこちら。バヌアツで地震が起きてから2週間以内に、日本で地震が発生する頻度は、僅かに、全体の頻度より低いようです。
これだけ見ると、バヌアツの法則を裏付けるようなデータは存在しないようですね。めでたしめでたし、なんですが、ちょっと気になる事があります。
この期間中には東日本大震災が発生していて、日本では大きな地震が頻発しているんです。当然、バヌアツの地震から2週間以外の期間で発生する地震も多くなりそうです。
そこで、日本とバヌアツの年毎の地震発生回数を折れ線グラフで表示させてみます。
結果はこちら。2011年を除外したデータでも確かめてみる、というのはやっておいて、よさそうな気がしますね。
2011年を除いたデータを調べる
2011年を除いたデータを作成し、さきほどと同様の計算をしてみました。
期間中の平均頻度が、0.0258回/日なのに対して、バヌアツの地震から2週間以内の頻度は0.0308回/日と、ちょっと高くなっているんです。
とはいえ、そんなに差があるわけでもなく、非常に微妙な感じです。これでは、モヤモヤが残っちゃいますね…。
THE 素人検証
私は、地震学も、統計学も専門的な知識がないので、本当は、ここでストップして、モヤモヤしたまま終わるべきなんでしょうが、それではつまらないので、さらにChatGPTコードインタープリターの手を借りながら、素人検証を進めてみたいと思います。
眉に唾をつけて聞いてください。
逆(日本→バヌアツ)はどうなのか?
こちらも差がありますが、バヌアツ→日本、ほどではないようです。逆のケースでも差があったら、どちらがどちらに影響を与えるという事ではなく、全体に活性化している時期があるみたいな話かな、とも思ったんですが、そういう事でもないようです。
他の国はどうなのか?
バヌアツ以外にも、同様の計算をして、その国で地震が起きてから2週間以内に日本で地震の起きる頻度を求めてみました(日本が入っていますが、日本の場合はその地震自体を含むので頻度が高くなってあたり前ですね)。
ただし、1回しか地震が起きていないのに、その2週間以内に、たまたま日本でも地震が起きてしまったというようなケースもあるので、そのような国は除外して、期間中の地震回数が50回以上の国に限って比較してみました。
こちらは、意外な事に、ニュージーランドや、メキシコ、アラスカの方が、バヌアツよりも頻度が高いのです。ニュージーランドだと南太平洋という事で近い感じもしますが、メキシコやアラスカが入ってくるとなると、バヌアツだけ特別扱いする必要はないし、まぁ、たまたまなんじゃないか、という気もしてきますね。
統計もどき解析
最後は、統計もどきの解析を試みます。
ランダムに、2週間の区間を139個(=期間中のバヌアツでの地震発生回数)とって、その期間中に日本で発生する地震の頻度を計算するんですが、この試行を1000回繰り返して、平均頻度がどんな風に分布するかを見てみました。
もしバヌアツの法則がまったく成り立っていなくて、ランダムだったとしたら、0.0308という頻度が、どのくらいレアなのか見てみたい、という事ですね。
結果的に言うと、そんなにレアではない、という感じでしょうか。
ランダムだとしたら滅多にないことが起きているので、きっと何か関係があるはずだ、と言えるような水準では、全くないと思われます。
個人的結論 「バヌアツの法則」は気にしなくてよい
以下の理由から、「バヌアツの法則」とされているもの(バヌアツでM6以上の地震が起きてから2週間以内に、日本でM6以上の地震が起きる事が多い)は、データ的には根拠薄弱ではないかと思われます。
20年間の全期間を通してみると、バヌアツで地震が起きてから2週間以内の頻度と全体の頻度にほとんど差がない。
2011年を除いたデータでみると、多少差があるように見えるが…
他の国でも、この程度の差は発見されるので、バヌアツだけ特筆すべきものでもないと思われる。
偶然にはありえないほどの差かというと、そんな事はないと思われる。
そして何より、2011年を除いたデータを見ても、頻度の差は1.19倍にとどまっている事もポイントです。
稀にしか起こらない現象が、仮に1.2倍起こりやすくなっていたとして、我々は、その水準にあわせて何か適切に行動を変容させられるでしょうか?
遠出や外出を控えて、耐震性の確保された建物に閉じこもりますか? どこか地震の少ないところに移動しますか?(でもどこで起きるかはわかりません)
これは過剰ですよね。
私は、そんな事はしないし、できません。
結局のところ、バヌアツで地震が起きてから2週間の間、1.2倍の警戒態勢をとるなんて事は不可能なので、普段から地震への備えをしっかりするしかないんだと思います。
※実際にコードインタープリターが出してきたコードなどは、次の記事に書いておこうと思います。
バヌアツの法則をコードインタープリターで確かめてみる コード編|usamix (note.com)
この記事が気に入ったらサポートをしてみませんか?