![見出し画像](https://assets.st-note.com/production/uploads/images/111219379/rectangle_large_type_2_e4781c7a795ad3d27efcd63c3c5467c9.jpeg?width=1200)
3. 土木遺産データ整形してみます
まず、身近なところで京都府のデータをサンプルにやってみます。
WEBのデータはこんな見た目です。
![](https://assets.st-note.com/img/1689782027283-QOFPbQTNvQ.jpg?width=1200)
上段に市町村名(京都はややこしいことに京都市〇〇区が存在します)、
その下段に都道府県名を挟んで
最後に土木遺産のデータが入っています。
■WEBデータをどうやって取り込むか?
①WEBキャプチャでいけるか?
②PDFは?
③やっぱりエクセルに張り付けか・・・
①②はダメ元でやってみます。
まず、①WEBキャプチャどーん!
![](https://assets.st-note.com/img/1689782207947-CXJ5zdL48C.jpg?width=1200)
京都府だけでえらいことになってしまいました。
![](https://assets.st-note.com/img/1689782256659-sEDu1R9doj.jpg?width=1200)
さすがにモニョモニョです。こんなの初めて見ました。。。
Prepさんごめんなさい。。。
![](https://assets.st-note.com/img/1689782614747-vC5Q4dcvFe.jpg?width=1200)
PDFも同じく。範囲の指定をやり直してみたりしましたが駄目でした。
Desktopでもやってみましたが、見たことのないエラーが・・・
![](https://assets.st-note.com/img/1689782810975-h5bswKHzVe.jpg)
で、大人しく③エクセルに張り付けで真面目にチャレンジします。
■WEBデータをエクセルに張り付けて取り込む
WEBページの範囲を全選択して、エクセルシートに貼ってみます。
もっと賢いやり方がありそうですが・・・
![](https://assets.st-note.com/img/1689783174243-Zu9Uk2ay9v.jpg?width=1200)
上段は削除して、都道府県名以下のデータの形にして読んでみます。
![](https://assets.st-note.com/img/1689783375004-hilLVK7XDe.jpg?width=1200)
上段に都道府県名も残したままなので(後でデータが確認しやすいのでそのままに)
まま、こうなるかな~とは思っていました。
ここでデータインタプリターマジック(もはや魔法だと思っています)!
![](https://assets.st-note.com/img/1689783396445-MmdYg7XZPx.jpg?width=1200)
大体読めている感じです。
ここで、元データ×エクセルの不安材料を再確認していきます。
①1レコードが2段になっているケースがある
②空欄の行が多数存在する
③価値評価欄に画像(赤丸にA)が存在する
![](https://assets.st-note.com/img/1689783673332-z7lrpDzg6g.jpg?width=1200)
![](https://assets.st-note.com/img/1689784554051-YT9qAwKMkn.jpg?width=1200)
![](https://assets.st-note.com/img/1689784516230-T65aHk0LIP.jpg?width=1200)
![](https://assets.st-note.com/img/1689783616461-S4QrVhLS5t.jpg?width=1200)
どうやら②は問題なさそうです(データ行とデータフィールドを確認)。
①はやはり2行になってしまっている様子。。。
![](https://assets.st-note.com/img/1689784759749-U2VRlR7HH5.jpg?width=1200)
③はNULLになっているようです。
![](https://assets.st-note.com/img/1689784936939-h6j7eMwiDK.jpg?width=1200)
というところで、今日はこの辺で。
①③解決できるでしょうか・・・