
家計調査のデータはどこにあるのか? ぎょうざ、ラーメン、ハンバーグ…、支出額日本一はこうやれば楽に探せる。
浜松市がぎょうざ購入額の日本一を3年ぶりに奪還したというニュースがありました。もはや恒例行事ですが、ニュースを見ていて例年と少し違うと感じたことがありました。それは、ぎょうざに限らず他の品目の日本一に触れるニュースが増えたこと。自分たちの街は実はこれの購入額が日本一でした、みたいなニュースを今年よく見聞きしました。これは報道各社に生データに関心を持つ記者が増えたということが背景にあるのではないでしょうか。やはり2024年はメディアにとってもデータサイエンス的な何かブレークスルーが起こりそうな予感がします。
生データはどこに
ヘッダーの絵は生成AIが描いた「ギョウザを食べながらギョウザについて分析するデータサイエンティスト」です。これは大きめの水餃子ですね…。それはさておき、本題に入ります。今回のニュースとなった総務省家計調査生データはどこにあるんでしょうか。
順を追っていきましょう。
まず、なぜ2月6日(火)にニュースになったのか。それは総務省から次の報道発表があったからです。
2023年の1年間の平均購入額が公表されたわけです。このプレスリリース中、3番目にある次のリンクに飛びましょう。

「詳細結果表(年)へ」というところで「二人以上の世帯」をクリック。

新着マークが付いた「2023年」をクリック。

品目ごとの1世帯当たりの支出金額を知りたいので、「<品目分類>1世帯当たり年間の支出金額、購入数量及び平均価格」の直下にある「都市階級・地方・都道府県庁所在市別 二人以上の世帯・勤労者世帯・無職世帯」の欄の右側にある「EXCEL」をクリック。

するとエクセルファイルがダウンロードされます。最初に開かれているシートは「全国」か「地方」単位のデータなので、都市別でまとまっているシート「二人・市別」に移動します。

下にスクロールしていき、「ぎょうざ」の品目が見つかりました。今度は右のほうにスクロールしていくと、「浜松市・支出金額」という列が見つかり、ぎょうざへの年間の支出金額が4,041円だったことが分かります。

確認の意味を込めて、宮崎市と宇都宮市も見てみました。宮崎市は3,498円、宇都宮市は3,199円で、それぞれニュースで紹介された額と同じでした。
関数で一括処理する
やはり生データをみると、わくわくします。支出金額だけでなく、購入頻度(100世帯当たり)というデータもあることが分かります。浜松市のギョウザの購入頻度は808回/100世帯でした。
ギョウザだけでなく、やっぱりそれぞれの全部の品目の1位が気になりますよね。
HO列の11行に
=INDEX($N$9:$HM$9, MATCH(MAX(N11:HM11), N11:HM11, 0))
という関数を入力してください。コピペでいいです。
※最初の投稿で、HO列の213行と書いてしまいましたが、HO列の11行の誤りです。なぜ213行が出てきたのか。朝3時なので寝ぼけてたかもしれません。申し訳ありませんでした。

上の関数をコピペしてクリックすると、次のようになります。

もう一度、HO列の11行のセルを選択し、セルの右下の隅にカーソルを持っていくと、カーソルが「+」マークに変わります。その状態でそのまま下にドラッグしていくと、関数がコピーできます。一番下までドラッグしてコピーします。

全ての品目について、支出額1位の都市が一気に抽出されました。※一番下に注釈をつけますが、あくまで簡易的な方法です。

これを見ると、浜松市はギョウザだけでなく、「すし(弁当)」や「うなぎのかば焼き」、「ハンバーグ」でも支出金額が1位であることが分かります。ハンバーグはやはり「さわやか」の存在が大きいのでしょうか。
横浜市はやはり「しゅうまい」、青森市は「やきとり」が好きなんですね。
ちなみに、静岡市は「緑茶」の支出額が全国1位。さすが茶どころです。
生データをみる醍醐味
このように、生データを手にし、関数などを使って自分なりに集計してみると、ニュースでは触れられなかった面白い情報を知ることができるかもしれません。記者の方はもちろん、こうした作業が自分の書く記事のアイデアに直結してくると思います。見慣れた自分の住む都市でも、思いもよらない新鮮な視点からアプローチできる可能性もありそうです。
冒頭の話に戻りますが、今年は例年より、ギョウザ以外の”おらがまち”の日本一を取り上げたニュースや、家計調査そのものを丁寧に解説したニュースが多かったように思います。オープンデータに興味があり、こうした作業を試してみた記者が多かったのではないかという良い兆しを感じました。
ぜひ皆さんも挑戦してみてはいかがでしょうか。
余談ですが、総務省のサイトをみていて、偶然こんな取り組みも知りました。
ドコモと連携した「総務省統計局提供、統計オープンデータを活用したデータ分析の手法を学べる講座」とのことです。
(注釈)実際のデータは1都市あたり、購入頻度、支出金額、購入数量、平均価格の4つがあり、今回入力した関数は、支出金額が最も大きいことを前提としている。おそらくこの前提はうまく機能し、全国1位の都市を抽出するには今回の関数で十分と思われる。ただ、上記の方法で取得したデータを使用する際は、正しいデータが取得できているか念のため各自で改めてご確認した後で使用してください。