気候変化シナリオデータを使ってみる
はじめに
2022年12月22日、文部科学省と気象庁より『気候予測データセット2022』の公開が発表されました。
実際のデータセットはDIASというプラットフォームを通じて公開されています。
余談ですが、DIASはディアスと読むようです。個人的にはダイアスだと思ってたのでちょっと違和感…。だって例えばbiasはバイアスだし…
閑話休題。
気候予測データセット2022については気候系セミナーでよく耳にしていましたので、ついに公開されたか!という感じです。私も時間を作って遊んで…もとい活用してみたいと思います。
さて今回のnoteでは気候系データを扱いたいと思いますが、先述した気候予測データセット2022とは別のデータを使ってみます。それは農研機構が提供するメッシュ農業気象データに含まれる気候変化シナリオデータです。
そこでまずはメッシュ農業気象データの紹介から始めたいと思います。
メッシュ農業気象データについて
農研機構さんご提供のメッシュ農業気象データは、気象庁さんの各種観測データや数値予報データを使い、過去実況から未来予測まで統一されたフォーマットで整備されたデータセットです。1日単位のデータが1kmメッシュで用意されており、気象要素は最高気温・最低気温・平均気温・平均湿度・降水量など、基本的な要素がそろっています。同じフォーマットで気候値も提供されています。主に農業分野で利用することを想定して作られていますが、他分野でも全然使えます。
その他、API的にデータを取得できるpythonモジュールが用意されていたり、平年値もあったり、技術情報も論文で公開されていたり、質問用Slackがあったりと、プロダクトもサービスもとても良いです。
利用にはユーザー登録が必要であり、開発・研究用途では無料で使えますが、商用利用は不可となっています。ただし、民間事業者が同等のデータを提供する有償サービスも存在します。
メッシュ農業気象データについて、詳しくは公式サイトをご覧下さい。
気候変化シナリオデータについて
メッシュ農業気象データの主なデータは過去実況〜短期・中期予測と気候値であり、ユーザーもこれらのデータを使っている人が多いと思います。一方、メッシュ農業気象データの隠れた凄い点(個人の主観です)は、気候シナリオデータセットも同一フォーマットで整備されており、同一APIで取得できることです。
メッシュ農業気象データに搭載されている気候シナリオデータセットは、IPCC第5次報告書に参加した気候モデル群『CMIP5』のデータセットです。このnoteを執筆している2023年2月時点では、上述の『気候予測データセット2022』や『CMIP6』など新しいデータも存在しますが、APIで比較的簡単にデータを取得できるので、メッシュ農業気象データで使ってみようと思いました。
利用できるモデルデータには、気象研のMRI-CGCM3や、東大AORI・NIES・JAMSTECのMIROC5などがあります。また、温暖化ガス排出シナリオとしては、RCP8.5(いわゆる4℃上昇シナリオ)とRCP2.6(2℃上昇シナリオ)に基づくデータセットが提供されています。
RCP8.5は何も対策をしないという非現実的シナリオで、RCP2.6はパリ協定の目標が達成された理想的なシナリオなので、RCPシナリオ4つのうち両極のデータが用意されている、ということでしょうか。
(現実的にはその間くらいを見たい気もします)
気候リスク評価をやってみる
…なんて言うと大げさだし、そんなに詳しくもないですが、せっかくアクセスしやすいデータがあるので、気候リスク評価のまねごとをしてみます。
使用したデータについて。今回は適当に選んだ地点として、つくば市の館野(高層気象観測地点)の緯度経度で地点データを取得しています。地点データ取得にはメッシュ農業気象データ専用のPythonモジュールを使用します。
データの種類は、まず気候変化シナリオの比較対象として過去の実況解析データを使用します。データの期間は、2001年〜2020年の20年間を使用します。
気候モデルは、私も縁のある研究機関が開発に関わっているMIROC5を選択します。また温暖化ガス排出シナリオとしては、RCP2.6とRCP8.5の両方を利用します。データの期間は実況解析の50年後ということで、2051年〜2070年を使用します。なんとなく、自分が生きている間に結果を確認できるくらいの範囲、という感じですかね。
気象要素としては、日単位の最高気温と降水量を使用します。よく地球温暖化によって今より猛暑が厳しくなるとか、大雨・洪水が増えるとか言われていますが、それらが気候モデルではどのように計算されているか、見てみたいと思います。
ではメッシュ農業気象データから必要なデータを取得します。
本noteは読み物メインで書きますので、データ取得および後述する分析に使用したコードはGitHubで公開することとします。
またコードを実行して実際にデータを取得するには、メッシュ農業気象データの利用申請をして、ユーザー登録してもらう必要があります。登録するとID・パスワードが発行されます。
ユーザー登録すると、データ取得するためのPythonモジュールやExcelツールを利用できるようになります。筆者はPythonでデータにアクセス・入手しています。
詳細はユーザー専用サイトや公式マニュアルがありますので、そちらをご参照下さい。またサンプルプログラムも入手できますので、それを見てコードの記述方法を調べるという手もあります。
私のデータ取得方法については、GitHub上のコードをご参照下さい。
データを取得したら、次は分析・可視化を行います。今回はRを使いました。
まず最高気温について時系列グラフを書いて、過去実況と各気候変化シナリオを比べてみます。過去実況は現在(執筆時は2023年2月)に近い2020年を、気候変化シナリオ2つは2070年を使い、1年間の最高気温を時系列グラフで描画します。
おや、あまりはっきりとした違いはないように見えます。RCP8.5(赤)が頭一つ抜けている期間もありますが、たまたまそういう年・季節だったと言える範囲にも見えます。
そこで今度は、過去実況と各気候変化シナリオそれぞれ、日付ごとの20年平均で時系列グラフを描いてみます。
今度はちゃんと、実況より気候変化シナリオの方が最高気温が高い傾向がはっきり現れました。特に冬季の気温上昇が大きいようです。
ただ一部メディアが煽っているような、地球がやばいとか人類が滅ぶとか、そんな状況になるような予測では全然ないこともよくわかります。
グラフで視覚的に確認しましたので、数値も見てみます。
過去実況・RCP2.6・RCP8.5それぞれ20年分の最高気温データについて、基本統計量を計算すると以下のようになります。
実況との平均の差はRCP2.6で約+1.4度、RCP8.5で約+2.1度となり、確かに気候変化シナリオの方は現在より気温を高く予測していることがわかります。
データの概要を確認しましたので、次は具体的なシチュエーションを想定して分析してみます。例えば気温が30度以上になると、品質の劣化などの影響を受ける物品を扱う事業をイメージしてみます。例えばそれは農作物だったり、工業製品だったりするでしょう。
では最高気温が30度以上になる日は年間どれくらいあるでしょうか。実況および各気候変化シナリオについて、年平均した最高気温30度以上の日数を計算してみます。
ざっくり言って、RCP2.6だと約10日、RCP8.5だと約20日、現在より最高気温30度以上の日数が増える予測となっています。例えば最高気温30度以上になったら何らかのコストをかけて対策する必要があることを想定すると、そのコストはRCP8.5では現在より約1.4倍に増加することがわかります。
次に、もう少し確率的な評価をしてみます。
1年間の各日付について、その最高気温が正規分布に従うと仮定します。そして実況・各気候変化シナリオは1日あたり20個のサンプルがありますので、それらの平均・分散を計算して1日ごとの正規分布を推定します。推定した正規分布を使い、『70%以上の確率で最高気温が30度以上になる日数』を求めてみます。
ここで「正規分布で本当にいいのか?」はよくわかりません。直感的にはそんなに悪くない気もしますが、しっかりと調べたわけではないです。温暖化しているなら上昇トレンドもあるかもしれませんし。まあここでは「とりあえずやってみよう」という姿勢でトライしています。
また『70%以上の確率で最高気温が30度以上』という設定が本当に重要になる具体的事例というのは特に思いつきませんが、この辺も「とりあえずやってみた」という感じです。
さて、その結果は以下の通りです。
30度以上になる日数を直接比べた場合よりも、過去実況と気候変化シナリオとの差が大きくなったように思います。
こんな感じで、何か具体的なシチュエーションや問題設定があれば、気候変化シナリオで予測されている気温上昇による影響を、定量的に見積もることができそうです。
次に日積算の降水量を見てみます。
地球温暖化によって大雨・洪水が増える=降水量が増えると言われますが、気候変化シナリオではどうなっているでしょうか。
まず以下のグラフは、日降水量20mm以上の日数を示したヒストグラムです。気候変化シナリオ2つとも図示するとわかりにくくなるため、代表してRCP8.5の方を使い、過去実況と比較しています。
これは…どうなんでしょう?
150mm以上の大雨はRCP8.5の方で増えていますが、100〜150mmの大雨で比べると実況の方が多いように見えます。
基本統計量も確認します。ここでは降水あり=0.5mm以上とし、降水ありの日に絞って計算しています。
最大値は気候変化シナリオの方が実況より大きくなっていますが、平均値は実況の方が大きくなっています。また気候変化シナリオ同士でも、RCP2.6の方が最大値が大きくなっています。イメージしていたのと異なる結果になりました。
さて降水量について、最近では『○○年に一度の大雨』なんて表現をよく聞くようになりました。これを確率降水量と呼ぶようです(※1)。
そこでここでは『100年に一度の大雨』が量的に何mmになるのか、推定してみます。この確率降水量の推定手法にはいくつか種類があるようですが、ここでは対数正規法で計算してみます(※2)。
なんと!気候変化シナリオよりも実況の方が『100年に一度の大雨』の降水量が大きくなってしまいました。また気候変化シナリオ同士でも、RCP8.5よりRCP2.6の方が降水量が大きくなってしまいました。
どういうことなのか。そこで過去実況と各気候変化シナリオの、20年間の日降水量上位20位を書き出してみます。
こうしてみると、最大値は気候変化シナリオの方が大きいものの、2番手以降は過去実況の方が大きいですね。。
これはおそらく、降水量という局地性の強い気象要素を、たった一つの格子点値で評価しようとしたこと自体が大きな間違いだったんだろうと思います。決して『地球が温暖化しても大雨は増えない』という結果が出たわけではないです、たぶん。
参考文献
(※1) 気象庁|異常気象リスクマップ|確率降水量
おわりに
ということで、気候リスク分析のまねごとをしてみました。メッシュ農業気象データはデータ取得部分でユーザビリティが非常に高く、比較的簡単に実施することができました。最新の気候予測データセット2022も、DIASから欲しい部分だけ取得できるような仕組みが整うといいなと思います。
また、こうした分析が今後ビジネスでも活用の幅が広がる可能性を感じると同時に、分析手法についてはもっと勉強したいと思いました。良い機会でした。
この記事が気に入ったらサポートをしてみませんか?