趣味のデータ分析025_単発小ネタ①_コンビニ半期決算で社会の階層化を語るな
ネタがあっち行ったりこっち行ったりして申し訳ないのだが、とんでもねー記事を見かけたので、単発ネタとして早めに処理しておく。結論を先に言っておくと、仮に日本がろくでもない国であるとしたら、その一端はこういう記事がのさばっているからだ。駆逐せよ。
データ分析における「浅はかさ」
とりあえず該当記事は下の二つである(連続記事)。
ちょっと長いが、二つから併せて抜粋(太字は引用者)。
前半の通常文字の部分は、全て事実である。というか、セブンの決算資料のp9に書いていることそのままであり、単なるコピペである。
一方で、この著者は経営コンサルタントを自称し、自身の名を晒した上で、セブンイレブンの2022年2~8月の売上と客足を、2019年2~8月の売上と客足を比較することで、そしてそれだけで「コロナ禍に加えて円安不況でコンビニを使うことができる日本人の数は減少傾向にある」ことを主張している。そして後段では、この分析と主張を引き継ぐような形で、コンビニ利用者の3類型を提示している。
こんなデータ分析というか主張は、個人的には、電車の中でナイフ振り回す「無敵の人」に遭遇するくらいの、誰もが恐怖する明らかに危険なものに思われるのだが、コメントとかを見るとそうでもないらしい。
データの確認
まあともかく、データの確認から始めよう。本記事では、セブンの2019年上半期vs2022年上半期という、極めて限定的な分析(というか決算資料からの抜粋)のみから、「コロナ」と「直近の円安」に起因して「コンビニを使うことができる日本人の数は減少傾向にある」ことを主張している。抜粋するだけで頭痛がする記述だが、まずは二時点比較ではなく、もっと長期の時系列を、そしてローソンとファミマの状況を確認することから始めよう。
というわけで、2016年以降のセブン、ローソン、ファミマの売上、客足、客単価の推移を見てみよう。まずは売上から。
左からセブン、ファミマ、ローソンである。分かりにくくてスマン。このグラフは、「2015年の1月~12月の売上を100とした場合の、以降の売上の推移」を表している。各折れ線は、各年を表しており、色が薄いほど新しい年になっている。直近はいずれも2022年9月である。
これは、元データが月次で「前年同月比」しかないからだ。なので、セブンの「2016年3月が101.5」であることと、「2017年8月が101.5」であることは、売上の絶対水準が同じことを表さないことには注意して欲しい。どちらかというと縦比較するイメージ。
さて、グラフの中身に移ると、セブンはさすがコンビニ最強、売上はコロナでもほぼ落ち込んでいない。ファミマとローソンは、特に2020年4月以降、つまりコロナ以降に急降下し、ファミマは回復、ローソンはまだ若干伸び悩んでいる姿が見える。ま、これはこれでよい。マジに見たいのは次の客足からである。
客足は、セブンでもコロナによって大幅に減少し、その後もせいぜい2015年の9割程度にとどまっている。ほか2社も同じような感じ(ローソンはやっぱりしんどそう)である。冒頭記事の話に即して見れば、とりあえず足元で、客足に円安、インフレの影響があるようには到底見えない。では最後に、客単価を見よう。
客足ときれいに逆の動きになっている。つまり3社とも、明らかにコロナのタイミングで水準が切り上がり、そのまま高水準で推移している。ま、図1と2から大体わかっていたことだけど。
最後に、大手3社含めたコンビニ7社合算の売上、客足、客単価の推移を見ておこう。ソースは日本フランチャイズチェーン協会。
これはセブン、ファミマ、ローソンに加え、セイコマ、山崎パン、ミニストップ、ポプラを合算したもの。図1~3と異なり、2016年1月=100とした、単純時系列推移である。月々の変動が激しいが、2020年3月までは売上高と客足がほぼパラレルだったのが、2020年3月で分離し、客足が少なくても売上高は比較的高水準を維持している。結果として客単価は上昇。要するに大手3社の動きと概ね同じである(というか、売上自体はファミマとローソンが特に調子が悪い感じもする)。このデータでも、円安がどうとかいう影響は一切見えない。
そしてもう一つ重要なのは、これらの動きからは、後半で主張されている「コンビニの客層」は一切分析できない、ということだ。これらの客足と客単価からは、例えば「コロナ禍によるテレワークで、職場や駅近くのコンビニを利用しなくなり客足全体は減少した」一方で、「コロナ禍で(遠くの)スーパーに行きづらくなり、(近くの)コンビニで生鮮食品等も購入するようになり客単価が増えた」または「コロナ禍で外食に行きづらくなり、コンビニで惣菜等を買う客が増え、客単価が増えた」などは仮説設定できるだろうが(もちろん追加検証は必要)、客層のデータは一切ここに含まれておらず、この数字で客層を含む仮説設定はそもそも不可能である。
まとめ・嘘吐きですらない人たち
さて、ちょっと丁寧目に冒頭の記事に記載の内容を分析してみた。結果、前半の「「コロナ禍に加えて円安不況でコンビニを使うことができる日本人の数は減少傾向にある」ということがこの数字から裏付けられます。」という記事の主張(分析内容)は、完全に誤りであることがわかった。客足の減少はコロナ禍直後から発生しており、記事で主張されているような円安の影響は全く見られないし、そもそもこのデータからは、コンビニの客層が3種類いるとかそういう話は導出不可能である。
円安の話からして、この著者は全くデータを見ていないことは歴然であり、その時点で完全なコタツ記事なのだが、それに加え著者が「無敵の人」であると言ったのは、「データから絶対に読み取れないことを読み取っている」からだ。以下、個人の独断と偏見に基づく。
こういう「データから絶対に読み取れないことを読み取っている(あるいは読み取らせようとする)」人は、もちろん愚か者、陰謀論者、電波系、超能力者もいるだろうけど、それ以上に「読み取る(読み取らせる)気がない人」が多いと思っている。やや深読みすれば、彼らは、自らの個人的経験と思い込みにしか基づかない主張の裏付けとしてデータを用いる。つまり、「自分の主張が正しいならこういう形でデータが出てくる」という形でデータを用いることで、「このデータからこの主張の正しさが裏付けられる」と語り、誤読させるのだ。データの存在は「自分の主張が正しい」証左では一切ないにも関わらず。
ただ実際は、ここまで深読みする必要がないことが大半だと思っている。つまり、彼らが嘘吐きで意図的な誤読を図っている、あるいは愚か者で自らの論理的誤謬に気づいていない、ということは多くないのではと思っている。
なぜなら、そもそもこういうコタツ記事はそこまで考えて読まれないからだ。「コンビニの商品は値段が高い」という多くの人が共有する「感想」をベースに、「円安不況」「アフターコロナ」「新たな階層化が進む」という、自称社会派に耳障りの良い言葉を加えることで、「コンビニの客層が変化した」という単なる妄想に社会的分析価値があるかのように偽装する。セブンの決算データなんぞ、この妄想を語るための導入部以上の意味は無い。
何となくデータを付けておけばそれだけで説得力増すでしょ、という嘘とも愚かさとも異なる浅はかさに基づくもので、読者も浅薄に読んでいる、と個人的には思っている。
そしてもう一つ感じているのは、こういう記事も「世論」形成の一つであり、数がすごく多く、それは問題であるということだ。実際この記事の作者の書いた書籍は20万部売れてるらしい。本は読んでないからしらんけど、こんな記事書いてる時点でレベルが知れるし、20万人も読んだとすれば結構問題である。ネット記事の方でも、コメントが1000以上付いてるし。
なぜ問題なのか。この記事は誤っており、世論形成に用いられるべきではないからだ。
ビジネスの判断、政策の決定、それらを含む社会的合意、ひいては民主的合意は、正しい情報と論理的推論、そして互いの配慮と敬意に基づく必要がある。こうしたプロセスからは、悪意のある嘘吐きや単なる愚かさは、ある程度排除される制度が整っていると思っている。しかし、浅はかさには必ずしも排除の制度がない。「諸説あります」とか「個人の見解です」で逃げられるような「浅はかさ」を排除する方法は、表現の自由のもとでは自明ではない。
だからこそ、こういう浅はかさに対しては、真っ向から否定する必要がある。別にこの記事がスポーツ観戦やラーメン屋の話題ならまあいいだろう。個人がどう思うかの範疇だし、そこには「個人の見解」が許される余地が充分あると思う。だが、格差や、不況や、社会階級の拡大や、その他倫理的話題はそうではない。真面目に対応する必要がある問題については、真面目に考えないといけないのだ。でないと、民主主義の根幹である、真面目な問題に真面目に対応するための世論が歪んで形成されてしまう。
浅はかさは態度の問題であり、「それは良くない」と指摘するシステムも自明ではない。だからこそ、その浅はかさを真っ向から指摘し、真面目に対応すべき問題を真面目に考える態度を失わせてはならないのだ。
さて、後半はほぼ駄文を書き連ねてしまった。またちゃんとしたデータ分析に戻る。ネタは引き続き散逸する予定。
補足・データの作り方等
今回のデータは、コンビニ大手3社の月次営業報告と、日本フランチャイズチェーン協会の統計を使用している。特に前者みたいなデータがきれいに公表されていることは全く知らなかった。フランチャイズオーナー向けだろうか。普通にすごいと思う。ていうか今回取り上げた記事の作者はこの程度のソースすら確認しておらず、その点でもマジでやべえと感じた。
ちなみに売上等のデータは、全店と既存店が取れるが、既存店で揃えている。これは単に、一部データが既存店でしか取れず、それに揃えたためである。pdfやhtmlでしか取れないデータも多く、地味に手間がかかった。