グラフをつくる前に読む本 棒グラフ編を全文無料公開します
本ノートは、深津さんのtweetを目にしたことをキッカケに、「全文公開って面白そうだ!」と共感して、2017年に刊行された「グラフをつくる前に読む本」の一部を無償公開しています。
グラフをつくる前に読む本とは、こんな本です。(amazonより内容紹介を抜粋します)
「このグラフどう見ればいいの?」
「このグラフ何かが間違ってる気がする…」
いままで雰囲気でグラフを作成してきたあなたは、こんな場面に出会ったことはないでしょうか。それもそのはず、エクセルやパワーポイントでなんとなく操作すれば簡単にグラフは作成できてしまいます。本書では、棒グラフ、折れ線グラフ、円グラフ、レーダーチャート、ヒートマップ、散布図などの主要なグラフの見せ方を歴史から丁寧に解説します。グラフの発明者たちは、どんなことを考えてデータをグラフにしたのでしょうか?
学校では教えてくれなかった正しいグラフの選択、わかりやすいグラフ表現の基礎を学び直しましょう。
本書では、棒グラフ、折れ線グラフ、円グラフ、レーダーチャート、ヒートマップ、散布図の最適な使い方と歴史を紹介しています。
グラフの歴史は日本国内に文献が無く、その殆どの論拠を国外に求め、制作に1年もかかった超大作です。歴史は読むだけでも楽しいと思います。
今回は、もっとも皆さんがよく使うであろう「棒グラフ」の章を無償公開します。ご一読頂ければ幸いです。
ビジネスの現場で最も使われている棒グラフ
はじめに取り上げる棒グラフは、ビジネスの現場で最も使われていると言ってもいいでしょう。私はデータ分析の仕事をしていて、棒グラフを作らない日はありません。まずは、この章で棒グラフの作り方、使い方、見せ方をしっかりマスターしていきましょう!
棒グラフを使えば「どのデータ項目が大きいか?」がわかる
まずは、図1の棒グラフを見てください。北海道、本州、四国、九州、沖縄それぞれの面積を表す棒グラフです。
図1:地方別面積
(国土地理院「全国都道府県市区町村別面積調」より作成)
棒グラフは、1つのデータ項目につき1つの棒を用意します。上のグラフでは北海道、本州、四国、九州、沖縄それぞれに1つの棒が描かれています。5つの棒を「比較」して、本州の面積が一番大きく、次いで北海道、九州、四国、最後が沖縄だと把握できたのではないでしょうか。
なぜこのグラフを見ただけで、直感的にそこまで理解できるのでしょうか? 棒グラフの見方を、順番に説明していきます。
各データは、地方別面積(㎢)というデータ項目を持っています。例えば約7.8万というデータは北海道の面積というデータ項目を持っています。
次に、データ項目ごとに、そのデータを棒の高さで表現します。縦軸にその高さがどれくらいの数量を表すかわかるよう、目盛りもあわせて描きます。
最後に、これが一番大事です。棒グラフは必ず複数のデータ項目を描きます。棒を1つだけ描く棒グラフを目にする機会はまずないでしょう。
棒グラフでは、複数並んだ棒の高さを比べて「棒が大きい(小さい)項目はどれだろう?」と考えます。つまり棒グラフが一番得意な表現方法はデータの「比較」です。棒グラフを使えば、比べたいデータを最もわかりやすく図で表現できます。
「高さ」を比べて項目の量の違いを感覚的につかめるのが棒グラフの特徴です。だから、本州の面積が一番大きいと直感的に把握できたのです。
続いて、どのように表現すればより比較しやすいのかを解説します。
データ項目の並び方を変えるだけでグラフの印象は変わる
棒グラフの奥が深いのは、カスタマイズ性が高い点にあります。
図1のグラフでは特に何も考えずに北海道、本州、四国、九州、沖縄の順番に並べました。実は、棒グラフは「データ項目」の並び順に意味を持たせれば、何が言いたいのかより伝わります。
図3の棒グラフを見てください。都道府県別人口をもとに棒グラフを作成しました。47個のデータ項目(都道府県)があるので、47個の棒が描かれています。
図3:都道府県別人口
(総務省統計局「2015年国勢調査人口集計結果」より作成)
このグラフは、人口の多い順に左から右に向けてデータ項目が整列しています。東京都の人口が一番多くて約1300万人、次に大阪人である私にとっては意外でしたが神奈川県約910万人、その後に大阪府が約880万人と続きます。棒の高さもそれにならって東京都がダントツで高く描かれています。
人口の多い順にデータ項目を並べて、棒グラフ全体を俯瞰して棒の高さを比較すると、日本の中でも東京都の人口が突出し過ぎているようにも見えますね。ちなみに、最も人口の少ない鳥取県約57万人と比べると、棒の高さは約23倍です。
このように、データの大きい順番や小さい順番などでデータ項目を並べて見ると、棒の高さに規則性が生まれるので、より比較しやすい棒グラフに仕上がります。全体の中でも突出しているデータ項目や、途中から傾向が変わっているデータ項目も発見しやすくなります。データ項目の並べ方は、意外と大事なのです。
図3のグラフだと、突出しているのは東京都、傾向が変わっているのは静岡県・茨城県だと見てすぐにわかります。このデータが表で提示されるとなると、気付きにくいはずです。
ところで、このように比較すると、なぜ私の住む大阪府の人口が神奈川県より少ないのか気になるところです。真っ先に思い浮かぶのは面積です。大阪府の面積は都道府県順で46番目、下から数えて2番目です。もう少し面積が広ければその分だけ人が住めて、神奈川県を追い抜けたのではないでしょうか。話は少し脱線しますが、図4のように都道府県別の人口密度(㎢あたり人口)を算出して棒グラフを作成しました。
図4:都道府県別人口密度(人口÷面積)
(総務省統計局「2015年国勢調査人口集計結果」及び
国土地理院「全国都道府県市区町村別面積調」より作成)
想像した通り、大阪府が神奈川県を抜いて左から数えて2番目になりました。大阪人としては「大阪府の人口が神奈川県より少ないのは面積が狭いため」と反論させてください。
一方で、神奈川県民からは「西部の丹沢山地や足柄山地など人口が住めない面積も含めた人口密度の算出は不公平だ。大阪は元々がほとんど平野で人が住めるところばかりだろう!」という声が聞こえてきそうです。確かに的を射た批判です。「そこまで言うなら、人が住める場所に限定した人口密度を計算したろうやないか!」と再反論させてください。しかし、そんなデータはあるのでしょうか?
なんと総務省統計局が、人間が居住可能な条件を備えた可住地面積(具体的には総面積から林野面積と湖沼面積を引いた面積)を都道府県別に発表しています。このデータを用いて都道府県別の可住地人口密度(可住地1.あたり人口)を算出して次ページ図5のような棒グラフを作成しました。
図5 都道府県別可住地人口密度(人口÷可住地面積)
(総務省統計局「2015年国勢調査人口集計結果」及び
国土地理院「全国都道府県市区町村別面積調」より作成)
大阪府と神奈川県の差は狭まりましたが、追い抜くまでには至りませんでした。内心、冷や汗をかいていました。一方で東京都が再びダントツで高く描かれています。東京都は都心である23区を除けば、西側の奥多摩地域や小笠原諸島など「ここが東京なの?」という場所は意外に多いので、そうした面積を除いた結果、高い棒が描かれたようです。1.あたり約9500人ですから、縦横10mあたり約1人という計算です。心地よい距離感とは言えませんね。
沖縄県の人口密度は意外と高い?「データ項目」の並べ方で気付きを得るには
棒を高い順番に並べる以外にも「データ項目」の並び方に意味を持たせる方法があります。データ量の多い(少ない)順ではなく、データ項目そのものが持っている法則や規則性の順番に並べる方法です。
図6:都道府県別人口
(総務省統計局「2015年国勢調査人口集計結果」より作成)
図6の棒グラフを見てください。先ほどと同じ都道府県別人口をデータに棒グラフを作成しました。ただし項目の並び方は、JISX0401にて定められている都道府県に割り振られたID(都道府県コード)順です。都道府県コードとは都道府県に付けられた数字で、北海道から始まり沖縄で終わります。北から南へ、東から西へ、各都道府県に順番に数字が割り振られています。
データは図3とまったく同じなのに、データ項目の並び順を変えるだけで見え方がまったく違う棒グラフが完成しました。巨大な都市(北海道、東京都、愛知県、大阪府、福岡県)が一定の間隔を空けて日本に数カ所あるとわかります。
データ項目の並び順はそのままで、図5のデータを使って可住地人口密度の棒グラフを作成したのが図7です。
図7:都道府県別可住地人口密度(人口÷可住地面積)
(総務省統計局「2015年国勢調査人口集計結果」及び
国土地理院「全国都道府県市区町村別面積調」より作成)
図6と見比べてください。大きな気付きが2つあります。1つは東京都、神奈川県、大阪府の人口密度の高さです。図6では北海道、埼玉県、千葉県、愛知県、福岡県も人口が多かったですね。それはこの3都府県に比べて広い土地があるからです。良いか悪いかは別にして、人口が密集しているのはこの3都府県だとわかります。
もう1つは沖縄県の可住地人口密度の高さです。データ自体は図5と同じです。都道府県に割り振られたID(都道府県コード)順に並べれば、近隣他県との比較がしやすくなり、意外と人口が密集している沖縄県の表現に成功しました。
棒グラフの一番得意な表現方法は「比較」だと述べました。しかし、単純に「比較」するといっても、どのようにデータ項目を並べるかで伝わり方は大きく変わります。棒グラフを作成する秘訣は、何を「比較」するためにデータ項目を並べるか、その順番にあると言っても過言ではありません。
時系列データにも対応している棒グラフ
1日や1年といった「時間」をデータ項目に持つデータでも、棒グラフで表現できます。
次ページ図8の棒グラフを見てください。はじめて実施された1920年から、以降は5年単位で実施されている国勢調査の結果による人口数を表す棒グラフです。
図8:国勢調査実施年ごとの人口統計
(総務省統計局「国勢調査」より作成)
1920年から1990年ごろまで、途中に1945年の終戦直後という例外はあるにしろ、一貫して右肩に伸びているのがわかります。1990年以降は伸びがかなり緩やかになり、2010年には前回比ほぼ横ばいになっています。人口が戦前や高度経済成長期のようにもう増えない、というのがわかるグラフです。
注意点として、時間をデータ項目にして棒グラフを作成する場合は、時間が経過していくように左から時間が古い順に、右に進むにつれて時間が新しくなるようデータ項目を並べる必要があります。
この約束を守らずに、時間の概念を無視して数字の大きい順番にデータ項目を並べてしまうと、間違いなく「これってどう見ればいいの?」、「こういう見方で合ってる?」という反応が周囲から返ってくるので注意しましょう。
棒グラフを作るときに意識しよう!
・棒グラフが一番得意な表現方法はデータの「比較」
・「高さ」を比べて項目の違いを感覚的につかめるのが棒グラフの特徴
・何を「比較」するためにデータ項目を並べるかを考えよう
「グラフ」の生みの親は誰なのか?
こんな便利な棒グラフを誰が考え出したのでしょうか。そして、いつごろの時代に発表されたのでしょうか。
ここまでわかりやすく、かつ誰もが知っている棒グラフを考え出した人物は、さぞかし頭が良かったに違いないとあなたは思われているかもしれません。しかし、実際はまったく違います(本人には失礼な言い方ですが…)。
統計データのグラフ化に挑んだ男:ウィリアム・プレイフェア
棒グラフを考え出したその人物の名前はウィリアム・プレイフェアです。1759年にスコットランドで生まれたプレイフェアが1786年に出版した「The Commercial and Political Atlas」(商業と政治の図解)の文中に、はじめて棒グラフが採用されました(図9)。
図9 「The Commercial and Political Atlas」の表紙
この本は、現代風に表現すると「図解でわかる!統計データ」とでも言いましょうか。今まさに手にしている本書と同じように、ウィリアム・プレイフェアは統計データを用いたグラフ表現に挑みました。
それまで貿易や財政に関する統計データは表に記載されるだけでしたが、ウィリアム・プレイフェアは数字を棒の長さで表現する方法を世界ではじめて公開しました。「見慣れないかもしれないけど、こっちのほうがパッと
見てわかりやすいじゃん?(意訳)」というコメントを付けて発表された4
0個のグラフのうちの1つが本章で解説する棒グラフでした。
つまり、まだ棒グラフが誕生して200年程度しか経っていないのです。大変な読書家でもあったフランスの国王ルイ16世は、この本を読んで「これいいじゃん、すげーわかりやすいじゃん」と言ったそうです。ただし、ウィリアム・プレイフェア自身が書き残した記録に残っているだけで、自作自演説が濃厚だと言われています。
現在でこそウィリアム・プレイフェアは政治経済学者であり近代的なグラフの創案者と紹介されていますが、彼の生涯は「バクチ」に負けた敗者の歴史と言っても過言ではありません。何より彼の死は「地元新聞社の元編集長の死」として取り上げられたに過ぎず、多大すぎる功績が評価されるのは死後でした。
プレイフェアの人生について、そして棒グラフが誕生する背景について追ってみましょう。
ウィリアム・プレイフェアの波乱万丈な生涯
プレイフェアは、牧師の家の四男として生まれ、13歳で父親を亡くします。以降はプレイフェア家の長男であるジョン・プレイフェアの手によって育てられました。11歳年上のジョンはかなり優秀で、数学の教授を務めるだけでなく、教会でも仕事をこなし、後年はロンドン王立協会の会員にも選ばれています。ちなみに次男のジェームス・プレイフェアは建築家として成功しており、「華麗なるプレイフェア一族」と表現しても言い過ぎではありません。
そんな環境のもとで育ったウィリアム・プレイフェアは、自分が「何者」であるかを証明するかのように 、さまざまな職業に就きます。しかし、どれも大成したと言えないまま逃げるように次の職を求めています。
まず、19歳になるとイングランド・バーミンガムへ行き、もともと機械いじりが好きだった影響もあってか、蒸気機関を改良したジェームズ・ワットの会社で製図師として働きはじめます。しかし安い給料に嫌気がさして23歳で独立します。20歳の頃に結婚した妻と子供を養えないからだと言われていますが、どこまで本当かは怪しいです。
独立してからは、イギリス・ロンドンで銀細工の店を開きます。「The Commercial and Political Atlas」は、ちょうどその頃に出版されています。しかし、事業は失敗に終わります。追われるかのように海を渡って、1787年にはフランスのパリに移住します。諸説ありますが、フランス人の人身売買に携わっていて、その一部の金銭を横領したから逃げるしかなかった、という小説顔負けの話もあります。
当時のフランスは、王政とそれに対峙する貴族、そして特権階級を敵視する民衆らの対立の真っただ中にありました。2年後の1789年7月14日にはバスティーユ襲撃を契機としてフランス全土に革命の波が押し寄せていきます。プレイフェアがバスティーユ襲撃に参加していたという話もあるぐらいです。お前スコットランド人やんけ! と私ならツッコミを入れますが、何かイベントがあれば参加したくなる性分なのでしょうか。
やがて革命が恐怖(テロル)に堕ち、密告と内乱によるギロチンの嵐が吹き荒れる頃、自分も危ないと思ったのか今度はドイツ・フランクフルトに移住します。彼は1793年には再びイギリス・ロンドンに戻りますが、その後も何とかして一発当ててやろうと奮起し、作家、商人、投資ブローカー、土地投機家、銀行家、編集者、翻訳者とさまざまな職業に挑戦しては、運命の女神に睨まれたかのように失敗を繰り返します。ベンチャースピリッツは持っていても、ビジネスを成功に導く手腕は持っていなかったようです。
さらに、1805年46歳には詐欺罪で有罪判決。1816年57歳には恐喝未遂、1817年59歳には名誉毀損で再び有罪判決を受けています。起業家の一面を持ちながらも、犯罪を重ねるプレイフェアという人間がよくわかりませんね。1823年、ウィリアム・プレイフェアはその生涯をロンドンで終えます。グラフの発明家としてではなく、日刊紙の元編集者として知られる程度でした。
一方、手当たり次第に鉄砲を撃っていた頃の弾の1つに過ぎない1冊の本が、ヨーロッパ全土、特にフランスとドイツにジワジワと浸透していきました。ウィリアム・プレイフェアにはグラフ作りの才能が確かにあって「The Commercial and Political Atlas」以降に出版した本に掲載されたグラフは多くの人間を魅了しました。そして、1800年以降はデータ表現の黄金時代が幕を開けます。本書で紹介する残りのグラフすべてがウィリアム・プレイフェアに直接関係するか、あるいは間接的に関わっています。しかし、その評判もイギリスにまでは届いていなかったようです。その理由として「あの人は素行が悪いから近付かないほうが良い、という評判が立っていた」説が有力だと言われています。つまり今も昔も「何を言ったかより誰が言ったか」が大切なのです。
グラフの発明家としてイギリス国内で再評価されたのは死後80年、1900年以降です。死後評価された芸術家としては、ゴッホや宮沢賢治と双璧だと私は思っています。
世紀の大発明だった棒グラフ
ウィリアム・プレイフェアの記した「The Commercial and Political Atlas」で表現されていた棒グラフは、現代の私たちが見ても十分に理解できるほど高い完成度を誇ります。次ページ図10で描かれる棒グラフを見てください。縦軸にデータ項目である国名を、横軸に輸出入ポンド(量)を表しています。国別に2本の棒があり、下の棒が輸出、その上の棒が輸入を表しています。
図10:スコットランドにおける国別の貿易データ
このグラフから、ロシア(Russia)やアイルランド(Ireland)といった特定の国と取引量が多く、輸出入超過も一瞬でわかります。産業革命の中心地であるイギリスにおいては、貿易は国力を強化する極めて重要な手段であったため、国別の輸出入記録は、政治家にとっても貿易商にとっても大事なデータでした。
縦に表現しているか、横に表現しているかという違いはありますが、私たちが普段から目にしている棒グラフと変わりありません。輸出入量というデータを棒の高さで表現し、かつデータ項目同士を「比較」させて、何が起きているかを明らかにしていました。さらに、データ項目が下に向かうほど棒が高くなっているのがわかります。何を比較するためにデータ項目をどの順番に並べるべきかまでウィリアム・プレイフェアは考えていたようです。
棒グラフは200年前に誕生した時点ですでに完成していたのです。200年前に発表された棒グラフが、ほとんど修正される機会もなく現在を生きる私たちでも読み解けるというのは奇跡ではないでしょうか? それほど、棒グラフは「世界的な大発明」であり、誰もが簡単にすぐに使えるグラフである証拠だと私は考えています。
棒グラフは年表にインスパイアされたおかげ?
なぜ、ここまで完成度の高い棒グラフを作成できたのか、何に影響を受けて棒グラフを思いついたのか、その背景は明確に解明されていません。一説には、イギリスの教育者だったジョセブ・プリーストリー(Joseph Priestley)が1765年に出版した「伝記年表」が影響を与えたのではないかと言われています。
この本には、歴史上の登場人物約2000人分の生没年表が、活躍した時期、地域に応じて作成されています(次ページ図11)。プリーストリー自身の言葉を借りれば、「非常に不完全になりがちな言葉の介在なしに、ひと目見るだけで、即座にさまざまな見方を提示できる」この年表は、もともと前ウォリントン学院の教師時代に歴史の授業で壁に貼って使う教材として作成されました。
図11:ローマ時代における政治家・学者の生誕から
死去までの期間を横棒で表現
プレイフェア自身、この年表を見ていたようで「系列立てて時間を刻むチャートにインスパイアされた」と語っているそうです。偉人たちの活躍した期間が1つの表に描かれ、かつその生存期間が線による長さで表現されれば、数字で見るより多くの気付きを得られそうです。ウィリアム・プレイフェアは年表を見て、データの数量に置き換えて表現できるとひらめいたのでしょう。
「The Universal Commercial History」と題された図12のグラフを見てください。1805年にプレイフェアが刊行した「繁栄と衰退の要因研究」の中で、この年表図に影響を受けたとわかるグラフを公開しています。
図12:約3000年以上の歴史を持つ国家と商業の勃興と歴史をグラフで表現
縦軸に国名、横軸に時間軸を並べて長い繁栄の秘訣をこの本で探っています。横軸には、年表のように、歴史上の重要な事象をコメントで記載しています。
ここまで似せて寄せたならばプリーストリーから「パクったよね?」と言われても仕方がないレベルです。しかし私は、ウィリアム・プレイフェアのこういうところが好きです。なぜなら、いろんな人の考えや意見を柔軟に取り入れ、自分なりに改良し、さらに良くしているからです。
グラフはデータを一瞬で伝えるために誕生した
ウィリアム・プレイフェアは「The Commercial and Political Atlas」の冒頭で次のように述べています。
as knowledge increases amongst mankind, and transactions multiply, it becomes more and more desirable to abbreviate and facilitate the mode of conveying information from one person to another, and from one individual to the many.
人類の間で知識が増え、取引が倍増するにつれて、ある人から見ず知らずの多くの他人に情報を伝達する方法は、簡略化して容易にすることがますます望まれています。
現代にも通じる話ではないでしょうか。
本書の冒頭でもふれたように、口頭で細かく数字を述べなくても、グラフは形で記憶するので覚えやすく、瞬時にデータの特徴を伝えられます。ウィリアム・プレイフェアは今から200年以上も前にこれを理解していたのです。言い換えると、ウィリアム・プレイフェアが取り組んだグラフという表現は、200年経ってもこの世に定着していないのです。もし浸透していれば、私がビジネスの現場で見づらいグラフに四苦八苦する機会はなかったからです。私は、本書をもってウィリアム・プレイフェアが切り開いた革命を200年越しに完結させたいと思っています。
棒グラフはこうして生まれた
・ウィリアム・プレイフェアによってデータを一瞬で伝える方法として生み出された
・200年前に国別貿易データを棒の高さで表現したのがはじまり
・生存した期間を棒の長さで表す伝記年表にヒントを得て生まれた可能性が指摘されている
▼グラフをつくる前に読む本