yahooのニュース記事一覧のタイトルとリンクを取得

書籍「Pythonでスクレイピングを始めよう: for Macユーザー入門学習編」のサンプルプログラムです。

import requests
from bs4 import BeautifulSoup

titles=[]
links=[]
url="https://www.yahoo.co.jp"
user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_6) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/12.1.2 Safari/605.1.15'
header = {
    'User-Agent': user_agent
}
r = requests.get(url,headers=header)

soup=BeautifulSoup(r.text, 'lxml')
elems = soup.select('.fQMqQTGJTbIMxjQwZA2zk._1alzSpTqJzvSVUWqpx82d4')
for elem in elems:
    if elems.index(elem)>=8:
        pass
    else:
        titles.append(elem.text)

elems = soup.select('.yMWCYupQNdgppL-NV6sMi._3sAlKGsIBCxTUbNi86oSjt')
for elem in elems:
    value=elem.get('href')
    if value == None:
        pass
    else:
        if "https://news.yahoo.co.jp/pickup/" in value:
            links.append(value)

for x in range(len(titles)):
    print(titles[x])
    print(links[x])

Yahooのニュース一覧のタイトルとリンクを取得するプログラムです。

詳しい解説は書籍をご覧いただけると嬉しいです。


いいなと思ったら応援しよう!