![見出し画像](https://assets.st-note.com/production/uploads/images/112034175/rectangle_large_type_2_861ac84ec0919b9904dbfd5f939f2c00.jpeg?width=1200)
5. Prepで重複削除にチャレンジ(寄り道)
↓この話の続きです(ちょっと今回は横道にそれてますが・・・)。
さて。
昔々イラレで作成した港湾施設(主にケーソン工法)の年表図を
Tableauで再現するというチャレンジですが・・・
【港湾名】ー【都道府県】を紐づけるデータがないことに気付きました。
最終的に北から順に並べたいので、何か一覧表が必要そうです。
①もともとのエクセルの別シートにケーソン工法のみ該当データあり。
これではちょっと不足です。
ただ、古い港湾名があるようなので残してはおきたいところ。
②国土交通省・港湾局のHPに【港湾管理者一覧表】というデータが。
https://www.mlit.go.jp/common/001403579.pdf
この【6.港湾一覧表】から都道府県名をとってみることにします。
①+②で目的の表を作ってみることにします。
とりあえずPrepに入れちゃいます。
不要な列を削除して・・・
![](https://assets.st-note.com/img/1690646189116-4Xm886hGkM.jpg?width=1200)
![](https://assets.st-note.com/img/1690646189094-88O8QLydgk.jpg?width=1200)
港湾一覧のほうは、カラム名が「湾」「名」で港湾の名称に"湾"がない。
ケーソン表は、カラム名が「湾名」「県名」で県名に"都道府県"がない。ユニオンしたいので、こちょこちょしてまとめてみます。
![](https://assets.st-note.com/img/1690646516507-3IwvsMEECt.jpg?width=1200)
![](https://assets.st-note.com/img/1690646516539-3qeEwFbpSQ.jpg?width=1200)
整頓して・・・いざユニオン!
![](https://assets.st-note.com/img/1690646601790-abucaN13Xa.jpg?width=1200)
無事に【港湾名】ー【都道府県】表っぽいものができました。
・・・あれ?
1,166行???
もともとの表で総数993となっていましたが・・・
![](https://assets.st-note.com/img/1690646868290-t8aoYaQrW7.jpg?width=1200)
重複ですね。
"神戸港"だけで10行くらい存在しているようです。
データの重複。。。
いつもエクセルで先に作業してごまかしてました。
ちゃんとTableauで操作できるようになりたい!!
no+eの中にステキな記事を見付けました!
とても丁寧に書いて下さっているので、
SQLとか意味不明な私でもなんとかなりそうです
(勝手にlink掲載してすみません。問題があれば削除します)!
ではやってみます。
![](https://assets.st-note.com/img/1690647211196-8Vwzc9Taqc.jpg?width=1200)
■計算フィールド
{ PARTITION [港湾名]:{ORDERBY[Table Names]:ROW_NUMBER()}}
![](https://assets.st-note.com/img/1690648104898-gUNxbeUqHT.jpg?width=1200)
【今回のケースで読み替えると】
・[港湾名]の重複を何とかしたい!
→ グループ:PARTITION
・順番は何でもいい
→とりあえずTable Namesで:ORDERBY
・いくつ重複しているか分からない
→とにかく番号をお願いします:ROW_NUMBER()
![](https://assets.st-note.com/img/1690647273073-lkKdxUzXs6.jpg?width=1200)
ここで番号が1のレコードだけ保持して完成です!
![](https://assets.st-note.com/img/1690648525915-6cLnOTFWR1.jpg?width=1200)
できました!
Linkしたページで紹介されているタイルも挑戦してみましたが、
記事でも触れられている通り
【いくつ重複しているか分からない】時はこの方法が良さそうです。
やっと必要なデータが揃った・・・ような気がします。
今度こそDesktopへ!