見出し画像

4. 先にケーソン年表の再現にチャレンジ

↓この話の続きです。

■復習:こんな表です(当初はイラレで描いてました)

誰も興味なさそうな話ですが、過去の自分への答えということで。
元データを見つけて簡単に整形できそうだったので先にやってみます。

目指す表はこんな形です。

ケーソン工法の歴史(年表)

明治後期~昭和初期に造られた防波堤と岸壁の年表です。
元はイラレの階層で表現しているのですが
今考えるとPPTで良さそうなところをわざわざイラレにしたのは
Tableauのハイライトみたいな表現がしたかった気がします。

■作りたいvizのイメージ

岸壁と防波堤の着工~竣工を表現したもの。
ケーソンとそれ以外の工法が区別でき、北から南の順に並んでいる。
できればそれ以外のデータでも何かインサイトが得られたらラッキー。

もとになっているエクセルデータはこんな形(防波堤と岸壁は別シート)。

防波堤/岸壁の一覧

時期が和暦になっているので、ここだけ工夫が必要かな・・・
↓自作の変換表があったので、これも使ってみます
(データとしては2列になっていたりしていけてないんですが、あえて)。

西暦和暦変換表

■Prepで元データを整形

とにかくエクセル表を単純に読ませてみます。

Prepで読み込んだところ

だいたい読めている感じです。
防波堤シートと岸壁シートをユニオンしておきます。

2シートをユニオン

時期のカラム(着工と竣工)が1項目にまとまってしまっているので
①着工と竣工に分ける
②西暦に置き換える

の2段階作業をやってみます。

①着工と竣工に分ける

元の時期のカラムはちょっと癖のある表記(パターン)になっている様子。
・”明治36”のように1年(着工と竣工が同年?)表記のもの
・"大正10-昭和1"のように年号も年数も2つ表示されているもの
・”昭和9-18"のように同じ年号で年数だけが2つ表示されているもの

時期カラム

【時期】のカラムを”-”でカスタム分割して、
”-”より前を着工【時期-始】とします。

カスタム分割

終わりのほうがちょっと厄介です。
計算フィールドで条件を書いて3パターンを再現します。
・分割された2個目が空欄なら(時期-始)を:着工と竣工が同年
・分割された2個目が2桁以上なら分割された2個目を採用:年号が2つ
・それ以外はもとの年号+分割された2個目:年号が1つ

3パターンを分ける条件式

もっとスマートな書き方があるかもしれませんが、
とりあえず3パターン表現できているようなので良しとします。

竣工(時期-終)が取れている様子

②西暦に変換する

例の西暦和暦変換表も読み込んでみます。
データとしていけてない点は以下の3点です。
・2列に分かれていること(印刷重視のためだったかも)
・年号が列として分けられていること(西暦と1対1の表でない)
・明治が45年以上(2004年まで)にも数字が入っていること

西暦和暦変換表

2列に分かれている問題 ⇒データインタプリタとユニオンで解決

ユニオン

年号が分かれている問題+年号が永遠に続く問題
⇒【和暦+何年】のようなカラムを新たに作成して

和暦+何年

⇒4つの年号でピボットして解決

年号でピボット

不要な列を削除したりして
【和暦】ー【西暦】だけの表ができました。

西暦和暦表

着工(時期-始)と竣工(時期-終)にそれぞれ西暦を結合で追加。

西暦を結合

古くいけてないエクセル表から、必要なデータが仕上がりました。

ケーソン表のもと(.hyper)ができるまでflow全貌

次回はTableauDesktopで作業していきたいと思います!

いいなと思ったら応援しよう!