見出し画像

【python学習日記④】Requests

全体のスクレイピングの流れがわかったので、あとはコードを書いていくだけです。今回は前回の学習日記③の1の部分を学習していきます。RequestsでHTMLを取得します。

Requestsを使用したことがない場合は、インストールから始める必要があります。コマンドプロンプト上で「pip install requests」でインストールできるみたいです。今回はAnacondaを使用しているので、ここはやっていません。

Reuquestsをインポートします。コードは単純で

import requests

です。Requestsを使用できるようになりました。次に、requestsを用いてスクレイピングしたいwebサイトのHTMLを取得します。

url = "https://www.python.org/" 
r = requests.get(url)

urlにスクレイピングしたページのURLを代入しています。そして、requests.get()という関数で、変数urlのページにアクセスします。今回はpythonの公式ページにアクセスしています。そして、、アクセス結果を変数rに代入しています。

これで、HTMLの取得が完了です。確認のために、print(r.text)で表示するとHTMLが表示されます。

コード自体は単純ですね。次回は、BeautifulSoupを用いてHTMLの解析をします。

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?