Googleスプレッドシート専用【IMPORTXML関数】を使ってWebデータを取得しよう
こんにちは!
突然ですが、IMPORTXML関数はご存知ですか?
一言で述べると、スクレイピングが出来る関数です。
例えば、自社の競合サイトを調べたい!というとき、Googleで検索し、一つ一つのサイトにアクセスしてページタイトルやディスクリプションなどのページ情報を手動で集め、Excelにまとめていくのではないでしょうか。
今回紹介する「スクレイピング」という方法なら、一つ一つ手動でまとめていく必要はありません。
Web上でのスクレイピングとは、必要な情報を自動で抽出することです。
今回は、スプレッドシートでスクレイピングを可能にする「IMPORTXML関数」について、簡単に説明していきます。
IMPORTXML関数の仕組み
この関数を使うと、Webページからデータを抽出してスプレッドシートに取り込むことができます。以下では、IMPORTXML関数の基本的な使い方と具体的な例を紹介します。
IMPORTXML関数の基本構文
IMPORTXML関数の基本構文は以下の通りです。
・URL: データを取得したいWebページのURLを指定します。
・XPath: 取得したいデータの位置を指定するXPathクエリを記述します。(ブラウザの検証モードから取得できます。)
具体的な使い方
例えば、株価情報を取得したい場合、以下のようなIMPORTXML関数を使用できます。
この例では、指定したURLからクラスが"stock-price"のspan要素のテキストデータを抽出します。
IMPORTXML関数の活用
IMPORTXML関数は、株価情報だけでなく、商品価格、ビジネスにおける競合サイトの情報など、さまざまなWebデータを取得するのに役立ちます。また、データを自動的に更新するため、常に最新の情報を保つことができます。
これで、スプレッドシートのIMPORTXML関数を使ってWebデータを効果的に取得する方法がわかりました。
是非、ご自身の仕事や情報収集に活用してみてください。