Googleスプレッドシート専用【IMPORTXML関数】を使ってWebデータを取得しよう

2023年9月29日 16:43

こんにちは！
突然ですが、IMPORTXML関数はご存知ですか？
一言で述べると、スクレイピングが出来る関数です。

例えば、自社の競合サイトを調べたい！というとき、Googleで検索し、一つ一つのサイトにアクセスしてページタイトルやディスクリプションなどのページ情報を手動で集め、Excelにまとめていくのではないでしょうか。

今回紹介する「スクレイピング」という方法なら、一つ一つ手動でまとめていく必要はありません。

Web上でのスクレイピングとは、必要な情報を自動で抽出することです。

今回は、スプレッドシートでスクレイピングを可能にする「IMPORTXML関数」について、簡単に説明していきます。

IMPORTXML関数の仕組み

この関数を使うと、Webページからデータを抽出してスプレッドシートに取り込むことができます。以下では、IMPORTXML関数の基本的な使い方と具体的な例を紹介します。

IMPORTXML関数の基本構文は以下の通りです。

=IMPORTXML(URL, XPath)

・URL: データを取得したいWebページのURLを指定します。
・XPath: 取得したいデータの位置を指定するXPathクエリを記述します。(ブラウザの検証モードから取得できます。)

例えば、株価情報を取得したい場合、以下のようなIMPORTXML関数を使用できます。

=IMPORTXML("https://example.com/stock", "//span[@class='stock-price']")

この例では、指定したURLからクラスが"stock-price"のspan要素のテキストデータを抽出します。

IMPORTXML関数は、株価情報だけでなく、商品価格、ビジネスにおける競合サイトの情報など、さまざまなWebデータを取得するのに役立ちます。また、データを自動的に更新するため、常に最新の情報を保つことができます。

これで、スプレッドシートのIMPORTXML関数を使ってWebデータを効果的に取得する方法がわかりました。
是非、ご自身の仕事や情報収集に活用してみてください。