PashaStyleの登録者のPashaIDと名前のリストを作成してみた
そういえば、PashaStyleの登録者数、どのくらいいるんだろう?
シンプルなPashaIDと名前のリスト一覧って、なかったような…。
作りました
githubの方のリストにも同じものを置いてます
※データは2023/01/12に実行した時点の登録者です。これ以降、増えたら、更新しないと古いままになります。
やった方法
pythonで作りました。
どういうロジックがシンプルでいいかな?と思ったのですが、観た感じそれぞれのIDに紐づいたページのh2タグが作家名・モデル名だったので、それを引っ張ってくればいいか?と。
URLが
https://pasha.style/member/users/{PashaID}
となっているので、1~今ある分だけPashaIDをループで指定して、h2タグ内の文字列を取ってきて、csvなどに保存して行けばいけるのでは?と。
実際に作ったコードは以下です。
業務ではPythonは使っていなく、rangeの指定はマジックナンバーでXXXXとしてます。ここを動的に出来たら、登録者が増えてもそのまま使えますが、夜のテンションでパパっと作ったので、今回はこのくらいでお許しを…。
# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import requests
import csv
with open('PashaID_Name_list.csv', 'w+',newline='',encoding='utf-8') as f:
for pasha_id in range(XXXX): # XXXXを好きな数字に
print('Pasha ID ' + str(pasha_id))
res = requests.get("https://pasha.style/member/users/" + str(pasha_id))
soup_content = BeautifulSoup(res.content, "html.parser")
writer = csv.writer(f, lineterminator='\n')
for n, subheading in enumerate(soup_content.find_all('h2')):
user_name = subheading.get_text()
writer.writerow([pasha_id, user_name])
pass
コードはgithubにも上げてます
感想
いろいろ出来そう。
プロフィールに記載のtwitterやinstagramのURLも取ってはこれましたが、人によっては設定がない人もいて、そのあたりは今回は省きました。
注意点
ループでひたすらアクセスして情報を取ってるので、複数人が一度にめっちゃ実行すると負荷がかかるので、おやめください。
その場合、実行者が責任を問われますので。