
Photo by
satoshi_st
ウェブスクレイピングを使ってGoogleスプレッドシートでHTMLテーブルを取り込む方法
ウェブページからデータを抽出する手法の一つとして、HTMLテーブルのインポートがあります。
これはスクレイピングと呼ばれ、Web上で公開されている情報を取得する手段の一つです。
Googleスプレッドシートでは、IMPORTHTML関数を使用することで、Webページ上のHTMLテーブルやリストからデータを抽出できます。
例えば、特定のテーブルを取り込む際は、関数内の「table」を「list」に変更し、インデックスにはデータを取得したい表の順番を指定します。
実際に試してみましょう。
例えば、Wikipediaの表を取得してみます。

=IMPORTHTML("https://ja.wikipedia.org/wiki/%E4%BA%BA%E5%8F%A3","table",2)
→

Googleスプレッドシートに表を取り込むことができました。
表の展開範囲に数値や文字列の記入があるとエラーになりますので注意が必要です。
ウェブスクレイピングを利用することで、手軽にWebページ上の情報を取得し、分析や可視化に活かすことができます。
データを効果的・効率的に利用して、生産性向上を目指しましょう!