![見出し画像](https://assets.st-note.com/production/uploads/images/111443605/rectangle_large_type_2_6a602bddf7310572c24742a938ff235b.jpeg?width=1200)
4. 先にケーソン年表の再現にチャレンジ
↓この話の続きです。
■復習:こんな表です(当初はイラレで描いてました)
誰も興味なさそうな話ですが、過去の自分への答えということで。
元データを見つけて簡単に整形できそうだったので先にやってみます。
目指す表はこんな形です。
![](https://assets.st-note.com/img/1690034451916-AZeTCI1TEs.jpg)
明治後期~昭和初期に造られた防波堤と岸壁の年表です。
元はイラレの階層で表現しているのですが
今考えるとPPTで良さそうなところをわざわざイラレにしたのは
Tableauのハイライトみたいな表現がしたかった気がします。
■作りたいvizのイメージ
岸壁と防波堤の着工~竣工を表現したもの。
ケーソンとそれ以外の工法が区別でき、北から南の順に並んでいる。
できればそれ以外のデータでも何かインサイトが得られたらラッキー。
もとになっているエクセルデータはこんな形(防波堤と岸壁は別シート)。
![](https://assets.st-note.com/img/1690034828561-130EAwqEQ4.jpg?width=1200)
時期が和暦になっているので、ここだけ工夫が必要かな・・・
↓自作の変換表があったので、これも使ってみます
(データとしては2列になっていたりしていけてないんですが、あえて)。
![](https://assets.st-note.com/img/1690120136194-G47TYG7rdN.jpg?width=1200)
■Prepで元データを整形
とにかくエクセル表を単純に読ませてみます。
![](https://assets.st-note.com/img/1690120195828-VB47KpEeDL.jpg?width=1200)
だいたい読めている感じです。
防波堤シートと岸壁シートをユニオンしておきます。
![](https://assets.st-note.com/img/1690120331241-MKnm8Rh5Oc.jpg?width=1200)
時期のカラム(着工と竣工)が1項目にまとまってしまっているので
①着工と竣工に分ける
②西暦に置き換える
の2段階作業をやってみます。
①着工と竣工に分ける
元の時期のカラムはちょっと癖のある表記(パターン)になっている様子。
・”明治36”のように1年(着工と竣工が同年?)表記のもの
・"大正10-昭和1"のように年号も年数も2つ表示されているもの
・”昭和9-18"のように同じ年号で年数だけが2つ表示されているもの
![](https://assets.st-note.com/img/1690120573128-IRc72yvRqb.jpg)
【時期】のカラムを”-”でカスタム分割して、
”-”より前を着工【時期-始】とします。
![](https://assets.st-note.com/img/1690120374167-HO2lKlsFS4.jpg?width=1200)
終わりのほうがちょっと厄介です。
計算フィールドで条件を書いて3パターンを再現します。
・分割された2個目が空欄なら(時期-始)を:着工と竣工が同年
・分割された2個目が2桁以上なら分割された2個目を採用:年号が2つ
・それ以外はもとの年号+分割された2個目:年号が1つ
![](https://assets.st-note.com/img/1690120823908-h1qUkuqke0.jpg?width=1200)
もっとスマートな書き方があるかもしれませんが、
とりあえず3パターン表現できているようなので良しとします。
![](https://assets.st-note.com/img/1690121017551-AwnyMDjrrL.jpg?width=1200)
②西暦に変換する
例の西暦和暦変換表も読み込んでみます。
データとしていけてない点は以下の3点です。
・2列に分かれていること(印刷重視のためだったかも)
・年号が列として分けられていること(西暦と1対1の表でない)
・明治が45年以上(2004年まで)にも数字が入っていること
![](https://assets.st-note.com/img/1690121609695-zWsYSOScHf.jpg?width=1200)
2列に分かれている問題 ⇒データインタプリタとユニオンで解決
![](https://assets.st-note.com/img/1690121334897-42jXygl095.jpg?width=1200)
年号が分かれている問題+年号が永遠に続く問題
⇒【和暦+何年】のようなカラムを新たに作成して
![](https://assets.st-note.com/img/1690121498399-8E3w832D4V.jpg?width=1200)
⇒4つの年号でピボットして解決
![](https://assets.st-note.com/img/1690122201699-e0hiIpAOVW.jpg?width=1200)
不要な列を削除したりして
【和暦】ー【西暦】だけの表ができました。
![](https://assets.st-note.com/img/1690122201697-4srRYgm5h7.jpg?width=1200)
着工(時期-始)と竣工(時期-終)にそれぞれ西暦を結合で追加。
![](https://assets.st-note.com/img/1690122201721-7MpzjCC6f6.jpg?width=1200)
古くいけてないエクセル表から、必要なデータが仕上がりました。
![](https://assets.st-note.com/img/1690122201663-q7PRftXheK.jpg?width=1200)
次回はTableauDesktopで作業していきたいと思います!