見出し画像

Webページ内のリンクURL一覧を一括で抽出する方法

GASラボではどなたでもご利用いただける自動化ツール・AIツールを企画・開発しています。
これまで企画開発したツール一覧は下記のページでご覧下さい。


ブログやオウンドメディアなど、Webマーケティング関連のお仕事をされている方なら、Webページ内のリンクURLを一括で抽出したいと思ったことがあるのではないでしょうか?

しかし、Webページ内のリンクURLを一括で抽出するには、Webスクレイピングを利用するのが一般的です。

さらに、Webページから抽出したリンクURLをGoogleスプレッドシートへ自動出力するには、プログラミングスキルが必要になります。

つまり、Webページ内のリンクURLを一括抽出してGoogleスプレッドシートへ出力・一覧化するのは、プログラミング知識のない方には難しい作業と言えるでしょう。

そこで今回GASラボでは、プログラミング知識のない方でもご利用可能な「Webページ内リンクURL一括抽出ツール」を開発しました。

本ツールを利用すれば、どなたでも簡単にWebページ内のリンクURLを一括で抽出して、Googleスプレッドシートに出力することが可能になります。

ご自身が運営するメディアのページ内リンクURLや、特定のWebページ内のリンクURL一覧を取得したい方は、ぜひ本ツールをご利用ください。

本記事では、Webページ内のリンクURL一覧を一括で抽出する方法として、今回GASラボが独自開発した「Webページ内リンクURL一括抽出ツール」を紹介します。

Webページ内リンクURL一括抽出ツール

Webページ内リンクURL一括抽出ツール

本ツールは、Webページ内のリンクURLを一括抽出して、Googleスプレッドシートへ自動出力するツールです。

リンクURL一覧を取得したいWebページのURLを指定すれば、自動でリンクURLを抽出し、Googleスプレッドシートへ出力します。

また、本ツールには、抽出したリンクURLの基本情報を取得する「簡易スクレイピング機能」を実装しています。

Webページ内に設置されているリンクURLには、アフィリエイトリンクなどが含まれているケースもあるので、簡易スクレイピング機能を利用することで、わざわざリンク先へアクセスしなくてもどのようなページなのかを判別することが可能です。

なお、本ツールはGoogle Apps Script(GAS)を利用したGoogleスプレッドシート形式のツールです。

Googleスプレッドシートが利用できるパソコンであれば、WindowsでもMacでも問題なくご利用いただけます。

新たにソフトをインストールする必要もありません。

内部リンク一覧や発リンク一覧、競合サイトやブログのページ内リンク一覧を取得したい方におすすめのツールです。本ツールは無料で配布いたします!

(本ツールで少しでもお力になれたら、「いいね」や「フォロー」、「シェア」などのサポートをいただけると、大変励みになります…!)

本ツールの入手方法は本記事の下部にてご紹介しておりますので、そちらをご確認ください。

【ご案内】法人でGASラボの有料ツールをご利用されるお客様へ

GASラボ法人プラン

GASラボではご購入されたユーザー様以外のツールのご利用を固く禁止しております。

法人でツールをご利用される場合は、GASラボの有料ツール全てを複数のユーザー様でご利用いただける「GASラボ法人プラン」にご加入ください。
※GASラボ法人プランならではの特典を多数ご用意しております。

>>GASラボ法人プランの詳細ご案内ページ

【ご案内】個人でGASラボの有料ツールをご利用されるお客様へ

GASラボでは、自動化ツールを100種類以上企画・開発しております。個人のお客様で複数のツールをご利用される場合は、お得なツールセットがおすすめです。


Webページ内リンクURL一括抽出ツールの3つのPOINT

今回開発したWebページ内リンクURL一括抽出ツールの主な特徴を3つのポイントにまとめて紹介いたします。ツールの仕様を要点でご理解いただく上で、ご確認ください。
※ツールの詳細な仕様は下記の記事をご覧下さい。

POINT1:指定Webページ内のリンクURL一覧をスプレッドシートに簡単抽出

指定Webページ内のリンクURL一覧をスプレッドシートに簡単抽出
  • 指定したWebページ内のリンクURL一覧を自動取得し、Googleスプレッドシートに抽出します。

POINT2:抽出したリンクURLの基本情報を取得する簡易スクレイピング機能搭載

抽出したリンクURLの基本情報を取得する簡易スクレイピング機能搭載
  • 取得したWebページ内リンクURLのうち、選択したURLの基本情報を取得できる簡易スクレイピング機能を搭載しております。

  • 簡易スクレイピング機能では、「title」「meta description」「meta og:description」「meta og:image」のデータを取得することが可能です。

POINT3:初心者でも安心!簡単操作

初心者でも安心!簡単操作
  • 本ツールのご利用にあたり、プログラミングコードの編集やコピー&ペーストの作業は不要です。

  • クリックと入力のみで操作できるため、どなたでもご利用いただけます。


Webページ内リンクURL一括抽出ツールのご利用イメージ

今回開発したWebページ内リンクURL一括抽出ツールのご利用イメージを画像を用いて紹介いたします。
詳しい設定方法については下記のマニュアルにもまとめておりますので、併せてご覧ください。

STEP1:配布リンクの本ツール(Googleスプレッドシート形式)をコピー

配布リンクの本ツール(Googleスプレッドシート形式)をコピー

本ツールは「Google Apps Script(GAS)」を事前に実装したツールのため、閲覧権限を設定しております。
ツールをご利用する際は、はじめに「ファイル」→「コピーを作成」をクリックし、ツールのコピーを生成してご利用ください。

STEP2:メニューより「ページ内リンクURL抽出」を実行し、WebページURLを指定

メニューより「ページ内リンクURL抽出」を実行し、WebページURLを指定

ツールのコピーを生成したら、「メニュー」→「ページ内リンクURL抽出」をクリックします。
すると、WebページURLを入力するテキストボックスが表示されますので、任意のWebページURLを入力して、「OK」をクリックしてください。
「ページ内リンクURL抽出」の実行が完了すると、「URLリスト」シート上に、ページ内のリンク一覧が出力されます。

STEP3:「URLリスト」シートにてスクレイピング対象ページを指定

「URLリスト」シートにてスクレイピング対象ページを指定

抽出したリンクURLのうち、ページの基本情報を取得したいページURLの「スクレイピング対象」(D列)にて、プルダウンから「●」を選択してください。

STEP4:「メニュー」より「スクレイピング」をクリック

「メニュー」より「スクレイピング」をクリック

プルダウンの選択が済んだら、「メニュー」→「スクレイピング」をクリックします。
スクレイピングを実行すると、「URLリスト」シートに、ページの基本情報が出力されます。

ページ基本情報出力イメージ


ご利用上の注意点

  • 本ツールの利用には、Googleアカウントが必要になります。

  • スクレイピング対象のWebサイトがスクレイピングを禁止している場合、本ツールでのスクレイピングはお控えください。

  • 本ツールはWebスクレイピングにてページ内リンクURLの抽出を実施しております。<a>タグのhref属性からURLを抽出する仕様となっておりますが、複雑なHTML構造など場合によっては、適切な結果が得られない場合がございます。予めご了承ください。

  • 上述の通り、Webスクレイピングにてページ内リンクURL一覧情報の抽出を実施しているため、ページによっては情報を抽出できないケースもございます。予めご了承ください。

  • 本ツールの利用で発生した問題の責任は負いかねます。事前に使い方をテスト、理解した上で、ご利用ください。

  • ツールおよびプログラムの著作はGASラボにあります。無断での転載・再販・配布・共有やソースコードのコピーは固く禁止しております。

  • 本ツールは処理時間に上限があります(約6分)。本ツールは処理時間に上限があります(約6分)。処理時間を超える場合には、データの取得・出力が完了できないケースもございますので、予めご了承ください。

  • 本ツールは初回利用時に「認証・許可プロセス」が発生します。認証・許可を下記の記事を参考に進めて下さい。

  • GASラボではツールをご利用いただけるのはご購入されたお客様1名様のみに限定しております。ご購入された個人のお客様以外のご利用は固く禁止しております。法人でツールをご利用される場合は「GASラボ法人プラン」に必ずご加入ください。


Webページ内リンクURL一括抽出ツールの今後の更新について(2024年7月1日時点)

ツールの機能追加について

基本的にユーザー様のリクエストなどをお伺いしながら機能の拡充に取り組んでいきます。

ツールの提供価格について

・今回のツールは無料で配布します!

(もしご満足いただけるツールであれば、いいねやフォロー、シェアをいただけると無料ツール開発の励みになります…!)

・公開から時間が経過したあとに有料化も検討しております。

GASラボのその他のツール開発について

  • GASラボでは、本ツール以外にも業務効率化・自動化に役立つツールの開発を進めています。

  • 今後も新規ツールやサービスをリリースしていく予定ではありますので、ご興味がある方はnoteTwitter(X)をフォローいただけると嬉しいです。


Webページ内リンクURL一括抽出ツールのご案内

下記のツール配布専用ページよりWebページ内リンクURL一括抽出ツールを入手してご利用ください。

Webページ内リンクURL一括抽出ツール無料配布ページ

https://www.gas-laboratory.com/courses/webpage-link-extractor


Webページ内リンクURL一括抽出ツールのマニュアルページのご案内

下記のページにWebページ内リンクURL一括抽出ツールの詳しいご利用マニュアルを用意しております。設定や操作については下記のマニュアルをご覧ください。


最後に

GASラボでは、今後も便利な自動化ツールや新規サービス、テンプレートを開発・公開してまいります。
自動化ツールだけではなく、業務効率化や自動化に関する情報もTwitter(X)にて発信しております。

最新情報はTwitter(X)にてご確認いただけますと幸いです。


いいなと思ったら応援しよう!