第1回 PythonでWebスクレイピング→WEBページの情報をそのまま収集
おはようございます。KUROMAMEです。
今回はPythonでWebスクレイピングを行います。
スクレイピングとはWebサイトから情報を収集してくる技術のことです。近年、機械学習等で人気のあるPythonですが、Webサイトの文字情報を一瞬で収集することができるんですね(@_@)
では、早速やりましょう
エディタはVSCodeを使用します。詳細は下記が参考になります。
また、「requests」モジュールなるものをインストールする必要があるため、下記を参考に実行します。
https://techacademy.jp/magazine/19195
今回はWebページを丸ごとスクレイピングしてみましょう。
コードは至って簡単です。 下記の3行のみとシンプル(@_@)
1.import requests
2.res = requests.get('収集したいページのURL')
3.print(res.text)
今回は私はyahooのトップページ(https://www.yahoo.co.jp/)を設定しました。
すると・・・
こんな感じで情報が一気に抜きとれましたね!
次回は、詳細に説明していきます。
この記事が気に入ったらサポートをしてみませんか?