花粉が「極めて多い」ってどういうこと? データアナリストへの道#27
勝手にレノファ山口FCを応援しているハラマルです。
さて、今シーズンのレノファ山口FCのホーム開幕戦が迫ってきました。(3月3日(日曜日)ですよ!)
「#レノファ1万人」を合言葉に集客が進められており、天気も晴れ予報ですし、新山口駅からのシャトルバスも大幅に増便されましたし、大掛かりな餅まきイベントもあるので、きっと最後の追い込みで、1万人達成するでしょう。
試合内容も、きっと良い結果をもたらせてくれると思います!
1万人で勝利を分かち合えたら、すごい盛り上がるでしょうね。ワクワクします。
敢えて心配な点を挙げるとすれば・・・、花粉ですかね。
花粉症に苦しんでいる私としては、毎朝の新聞で「今日の花粉情報」のチェックが欠かせません。
「やや多い」の日は、「あ~、遂に始まったかぁ」と思いますし、
「多い」になると、「気を付けないとヤバいな」となります。
「非常に多い」だと、もう外に出たくありません。
そして、2月27日の朝刊で目に飛び込んできたのは、「極めて多い」。
!!!え、やばい。そんな表現を見るだけで目がかゆくなります。
いや、「極めて多い」?そんな表現って今まであったっけ?
というか、極めて多いってどれくらいのことなんでしょうか?
ということで、今回は花粉データを分析してみようと思います。
花粉情報はどこにある?
さて、皆さんは、花粉情報って誰がどのように公開されているか御存知でしょうか?
花粉症って、もはや国民的な病気みたくなっているので、きっと気象庁?とか思って、気象庁のいろんなデータをダウンロードできる便利なサイトを見てみたのですが、ここにはありませんでした。
あれ?と思って調べていると、気象庁のサイトにはこのように書かれていました。
つまり、我々がよく目にしている、今日は花粉が多い/少ないといった「花粉の情報」は、発芽や気象データを用いて計算された結果としての「飛散予測」ということのようです。
「飛散の予測」で「悲惨な予測」がされていたというわけです。
では、予測情報ではなくて、実際にこれくらいの飛散があったというデータは、どこかに公開されているものなんでしょうか?
もうちょっと調べてみると、こちらの環境省のサイトに行きつきました。
こちらの「花粉情報サイト」で分かったことがいくつかありました。
まず、実際の花粉飛散量については、「環境省花粉観測システム(愛称:はなこさん)」というもので測定されていたそうですが、何と、令和3年12月に運用が終わっていました!
現在は、「NPO法人花粉情報協会」というところが、2月~5月の期間、全国24地点の毎日の飛散量を公表してくれています。
こちらのサイト(花粉いんふぉ)では、2020年以降のデータを確認することができました。
また、次に分かったことは、「花粉情報サイト」にいろいろな資料があり、その中に、令和5年12月に「花粉飛散量の標準的な表示ランク」が改訂されたという記述がありました。
この改訂により、1平方cm当たりの花粉の数により、
10個未満・・・「少ない」
10個~30個未満・・・「やや多い」
30個~50個未満・・・「多い」
50個~100個未満・・・「非常に多い」
100個以上・・・「極めて多い」←NEW ととされたようです。
つまり、「極めて多い」は、今シーズンから使われ始めた表現のようです。私が購読しているのは山口新聞なのですが、私のチェックしていた範囲では、令和6年2月27日に初めて使われたのではないかと思います!(違ってたらごめんなさい)
そりゃ、びっくりするわけだ。結構、衝撃的な表現です。
また、山口新聞をよく見てみると、「提供=県医師会」という記述がありました。
「一般社団法人山口県医師会」のサイトを見てみると、こちらには、丁寧に、飛散予測と飛散数の両方のデータが掲載されていました。
ということで、整理しますと、花粉の飛散予測ではなくて、実際に飛散した花粉量のデータとして、3つ見つけました。
1つ目は、環境省の「はなこさん」で、一番古くは2003年から(ただし関東地方のみ)データがありますが、2021年に更新が止まっています。
観測地点もたくさんあったようで、山口県内には3箇所もあったようです。
また、測定は時間ごとになっているので、データ量としてはかなりボリュームがあります。
更新が終わっているのが大変残念です。
2つ目は、「NPO法人花粉情報協会」による「花粉いんふぉ」に掲載されている2020年以降の全国24カ所のデータです。
こちらは1日ごとになっていますし、観測地点も緯度経度情報があったりなかったりで、はなこさんとの整合性が確認できません。
また、良く見ると、はなこさんは「花粉自動測定器による観測データ」とあり、花粉いんふぉには「ダーラム法による計測結果」とあり、もしかしたら計測や測定の方法が同一でない可能性もあります。
ということで、この2つのデータの統合は諦めた方が良さそうです。
3つ目は、山口県医師会です。
このデータを分析しようと思ったのですが、データがダウンロードできるようになっていないのと、表中の「→」がどういう意味かわからず、修正しようにも修正の仕方が分からないため、泣く泣く断念です。
ということで、直近の状況も含めて分析したいので、花粉情報協会さんの「花粉いんふぉ」に掲載されている「ダウンロード用」というデータを使わせていただきました。
ただ、ダウンロード用といっても、セル結合されて数字が入っていたり(休日等で連続捕集した場合の平均値だそうです。それぞれに平均値を入れ直しました)、年度間で観測地点が変わっていたり(特に説明がなかったので、コピペ作業にズレが生じて気づきました)、データ収集・終了日が一律でなかったり(結局、一つ一つ、開始・終了日を確認しました)、中には空欄に見えるけれど白い字で数字が入っていたり(データの数が合わないので原因を探しまくりました)、2021年はなぜか2・3月のデータしか掲載されていなかったり(これはもう諦めるしかない)、データ分析泣かせの状況ではありました。
全国のスギ/ヒノキ花粉飛散(悲惨)量と時期
それでは、データが不揃いなのが気になりますが…、Tableauを使ったデータ分析をやってみましょう!
まずは、スギ花粉の飛散情報を、日ごとでは気象条件によって大きく差が出てしまうため、傾向をみるために週ごとに集計してみました。
これ、日付データがあるので、年ごと、四半期ごと、月ごと、週ごと、日付ごとに、改めて計算することなく簡単に分析できるのがTableauの素晴らしいところです。
山口県の観測地点は2024年からしか設置されていませんでしたので、隣接している広島県(広島市→尾道市に変更)、福岡県福岡市の3都市を赤色に着色してみました。
まず目につくのが、2023年の飛散量の多さです。全国的に、他の年と比べても何倍にもなっていますね。
いや~、確かに去年は辛かった。ホント、悲惨です。
2020年も私は花粉症で苦しみましたが、今と比べたら、ほとんど飛散していないと言っても過言ではないレベルですね。
それから、ピークの山の位置に地域差があります。これは花粉の飛散予測でも指摘されていることですね。
山口・広島・福岡(赤色)は、2月20日頃~3月5日頃の間にピークがきているようです。
同じような位置にピークがあるのは、愛媛県や宮崎県などです。
ピークの位置が右にずれている(後にくる)のは、青森県や山形県、福島県などです。
2024年を見ると、もしかしたら、山口県は既にピークを過ぎているのかもしれません。そのような形状のグラフになっています。
今年は、耳鼻科と眼科で、「去年よりは花粉少ないらしいよ」とお医者さんに行ってもらったのですが、ピークの山の高さをみると、昨年に比べて極端に少なくなっているわけではなさそうですね。気休めで言ってくれたのかな(笑)?
他の地域も少なくなっているようですが、静岡県だけ山が高くなっています。
全国的にはスギのピークがまだな地域もあるので、これは、もう少し経ってからでないと評価できないですね。
次に、ヒノキをみてみましょう。
ヒノキ花粉も、2023年がとても多かったのがわかります。
そして、こちらの方は、赤色の山が、全体の山に対して大きくなっている印象があります。つまり、スギ花粉と比べ、全国の中でも、山口・広島・福岡は、ヒノキ花粉の影響が大きい地域と言えます。
2023年には、福岡県が3番目の高さになっています。
ヒノキは、スギに比べて、飛散し始める時期が遅いのは知っていましたが、飛散時期も、スギに比べてバラツキが少なく、限定的なようです。
あまりピークの山の位置にずれがなく、パッと飛散が始まって、パッと飛散が終了するようですね。
今年はまだ全国でもヒノキ花粉の飛散が始まっていないようです。
全国のスギ/ヒノキ花粉飛散(悲惨)量マップ
次に、私の大好きなマッピングです。
本当は、地点ごとに表したかったのですが、観測地点の変更があることから、都道府県単位にしてみました。
また、期間の合計量で表していますが、データが不揃いな2021年と2024年を除いています。
まずスギ花粉です。
調査箇所が全都道府県にあるわけではないので、歯抜けのマップですが、概ね、東北地方が多いのと、宮崎県が目立って多いのが特徴的ですね。
少しずつ、色が濃い箇所が南に下ってきていないか心配です。これはもう少し長期的に見た方がよさそうですね。
ヒノキはこちらになります。
スギに比べ、明らかに日本の中央部の方で多くなっていますね。
これも山口県に近づいてきているような印象もありますし(被害妄想?)、実際、福岡県も多いので、花粉症持ちの私からすると、山口県への包囲網が縮まってきていないか心配になります。
花粉が「極めて多い」日
それでは、新しくできた指標「極めて多い」というのが、どの程度のものか見てみましょう。
先ほど作ったグラフを、週ごとの集計から日にちごとに変更します。この操作も非常に簡単です。
それから、測定値に100のリファレンスラインを入れてみました。これが「極めて多い」の水準になります。
はい、スギ花粉はこちら!
ギャー、あっさり超えとるやん!
山口・広島・福岡(赤)は、2020年こそ超えた日がなかったものの、2021年2月20日頃から3月2日くらいまでの間、極めて多くなっていました。
2022年は、福岡市の3月12・13日の2日間だけの該当でしたが、2023年は超えまくってますね。赤色の最大は広島県の2月28日の543という数値でした。
そして、2024年ですが、私が新聞で見た「飛散予測」では、2月27日に初めて「極めて多い」となっていましたが、実際の飛散量としては、2月20日の時点で山口県は「極めて多い」となっていました。
その他の地域(青)も「極めて多い」のラインを超えまくっていますね。
「極めて多い」という表現に、かなり警戒感を抱きましたが、我々は、既にそういう日を乗り越えてきたんだということが分かりました。
ヒノキもみてみましょう。
ヒノキ花粉の方は、山口・広島・福岡(赤)の超えっぷりが目立ちます。
うわぁ、こんな中、生活してのか…。そりゃ、花粉症になったり、重症化したりしますよね。
良く乗り越えてきた、自分!
というわけで、「飛散予測」としては、「極めて多い」という表現が新しく用いられましたが、実態としては、我々は既にそういう日々を体験し、乗り越えてきたという自信を持つことができました。
ここで話を台無しにしてしまうようなことを言ってしまいますが、いろいろなサイトを見てみると、この「極めて多い」を使わず、従来のように「非常に多い」が一番上の評価としている予測もあるようです。
まぁ、こんなに超えていたら、「非常に多い」も「極めて多い」も大差ないという考え方もあるかもしれませんね。
広島・福岡の詳細
それでは、最後に、もう少し詳細をみてみましょう。
本当は山口県のデータで分析してみたかったのですが、観測地点がないため、やむなく、広島と福岡を日ごとに並べてみます。
今度は、スギとヒノキを同じグラフに並べてみました。
このように上下で並べてみると、スギとヒノキのピークの時期差が分かりやすいですね。
スギ花粉の方が、花粉症の人が多いような印象がありますが、この期間で1日の飛散量が最も多かったのは、ヒノキの方ですね。2022年3月24日の福岡県観測所の809.5という数値となっています。
さて、このグラフをよ~く見てみると、なんと!レノファ山口FCの今シーズンホーム開幕戦がある3月3日は、スギ花粉のピークが過ぎて、ヒノキ花粉のピーク前、花粉症持ちの方にもたらされた奇跡の狭間かもしれません!
ということで、冒頭に心配していた花粉も、怖がらずに外出できるのではないでしょうか。しっかり対策すれば、今まで乗り越えてきた壁です。きっと大丈夫です。
花粉症をお持ちの方も、是非、勇気を持って外出して、3月3日、みらスタに集まって、勝利を分かち合いましょう。
きれいにまとまった!?