第1回 PythonでWebスクレイピング→WEBページの情報をそのまま収集

おはようございます。KUROMAMEです。

今回はPythonでWebスクレイピングを行います。

スクレイピングとはWebサイトから情報を収集してくる技術のことです。近年、機械学習等で人気のあるPythonですが、Webサイトの文字情報を一瞬で収集することができるんですね(@_@)

では、早速やりましょう

エディタはVSCodeを使用します。詳細は下記が参考になります。

また、「requests」モジュールなるものをインストールする必要があるため、下記を参考に実行します。

https://techacademy.jp/magazine/19195

今回はWebページを丸ごとスクレイピングしてみましょう。

コードは至って簡単です。 下記の3行のみとシンプル(@_@)

1.import requests

2.res = requests.get('収集したいページのURL')

3.print(res.text)

今回は私はyahooのトップページ(https://www.yahoo.co.jp/)を設定しました。

すると・・・


スクリーンショット 2020-11-05 075017

こんな感じで情報が一気に抜きとれましたね!

次回は、詳細に説明していきます。


この記事が気に入ったらサポートをしてみませんか?