見出し画像

ウェブスクレイピングを使ってGoogleスプレッドシートでHTMLテーブルを取り込む方法

ウェブページからデータを抽出する手法の一つとして、HTMLテーブルのインポートがあります。

これはスクレイピングと呼ばれ、Web上で公開されている情報を取得する手段の一つです。

Googleスプレッドシートでは、IMPORTHTML関数を使用することで、Webページ上のHTMLテーブルやリストからデータを抽出できます。

例えば、特定のテーブルを取り込む際は、関数内の「table」を「list」に変更し、インデックスにはデータを取得したい表の順番を指定します。

実際に試してみましょう。

例えば、Wikipediaの表を取得してみます。

Wikipediaより抜粋

=IMPORTHTML("https://ja.wikipedia.org/wiki/%E4%BA%BA%E5%8F%A3","table",2)

GoogleスプレッドシートのA1にIMPORTHTML関数を記入

Googleスプレッドシートに表を取り込むことができました。
表の展開範囲に数値や文字列の記入があるとエラーになりますので注意が必要です。

ウェブスクレイピングを利用することで、手軽にWebページ上の情報を取得し、分析や可視化に活かすことができます。

データを効果的・効率的に利用して、生産性向上を目指しましょう!

この記事が気に入ったらサポートをしてみませんか?