見出し画像

PashaStyleの登録者のPashaIDと名前のリストを作成してみた

そういえば、PashaStyleの登録者数、どのくらいいるんだろう?

シンプルなPashaIDと名前のリスト一覧って、なかったような…。


作りました



githubの方のリストにも同じものを置いてます

※データは2023/01/12に実行した時点の登録者です。これ以降、増えたら、更新しないと古いままになります。

やった方法


pythonで作りました。

どういうロジックがシンプルでいいかな?と思ったのですが、観た感じそれぞれのIDに紐づいたページのh2タグが作家名・モデル名だったので、それを引っ張ってくればいいか?と。

URLが

https://pasha.style/member/users/{PashaID}

となっているので、1~今ある分だけPashaIDをループで指定して、h2タグ内の文字列を取ってきて、csvなどに保存して行けばいけるのでは?と。

実際に作ったコードは以下です。
業務ではPythonは使っていなく、rangeの指定はマジックナンバーでXXXXとしてます。ここを動的に出来たら、登録者が増えてもそのまま使えますが、夜のテンションでパパっと作ったので、今回はこのくらいでお許しを…。

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import requests
import csv

with open('PashaID_Name_list.csv', 'w+',newline='',encoding='utf-8') as f:
    for pasha_id in range(XXXX): # XXXXを好きな数字に
        print('Pasha ID ' + str(pasha_id))
        res = requests.get("https://pasha.style/member/users/" + str(pasha_id))
        soup_content = BeautifulSoup(res.content, "html.parser")
        
        writer = csv.writer(f, lineterminator='\n')

        for n, subheading in enumerate(soup_content.find_all('h2')):
            user_name = subheading.get_text()    
            writer.writerow([pasha_id, user_name])
pass

コードはgithubにも上げてます

感想

いろいろ出来そう。

プロフィールに記載のtwitterやinstagramのURLも取ってはこれましたが、人によっては設定がない人もいて、そのあたりは今回は省きました。

注意点

ループでひたすらアクセスして情報を取ってるので、複数人が一度にめっちゃ実行すると負荷がかかるので、おやめください。
その場合、実行者が責任を問われますので。

いいなと思ったら応援しよう!