3. 土木遺産データ整形してみます

2023年7月20日 01:45

まず、身近なところで京都府のデータをサンプルにやってみます。
WEBのデータはこんな見た目です。

上段に市町村名（京都はややこしいことに京都市〇〇区が存在します）、
その下段に都道府県名を挟んで
最後に土木遺産のデータが入っています。

①WEBキャプチャでいけるか？
②PDFは？
③やっぱりエクセルに張り付けか・・・

①②はダメ元でやってみます。
まず、①WEBキャプチャどーん！

京都府だけでえらいことになってしまいました。

さすがにモニョモニョです。こんなの初めて見ました。。。
Prepさんごめんなさい。。。

PDFも同じく。範囲の指定をやり直してみたりしましたが駄目でした。
Desktopでもやってみましたが、見たことのないエラーが・・・

で、大人しく③エクセルに張り付けで真面目にチャレンジします。

WEBページの範囲を全選択して、エクセルシートに貼ってみます。
もっと賢いやり方がありそうですが・・・

上段は削除して、都道府県名以下のデータの形にして読んでみます。

上段に都道府県名も残したままなので（後でデータが確認しやすいのでそのままに）
まま、こうなるかな～とは思っていました。
ここでデータインタプリターマジック（もはや魔法だと思っています）！

大体読めている感じです。
ここで、元データ×エクセルの不安材料を再確認していきます。

①1レコードが2段になっているケースがある
②空欄の行が多数存在する
③価値評価欄に画像（赤丸にA）が存在する

どうやら②は問題なさそうです（データ行とデータフィールドを確認）。
①はやはり2行になってしまっている様子。。。

③はNULLになっているようです。

というところで、今日はこの辺で。
①③解決できるでしょうか・・・

いいなと思ったら応援しよう！