Python童貞卒業とは言えないかも4/5
④・スクレイピング先のURLの組み立て
介護保険サービスの事業所番号は頭の2桁が都道府県で次の一桁が介護保険サービス事業所の場合7。次の二けたが群市区番号で次の4桁がオリジナル番号、最後の一桁が暗号っぽい奴。モジュラス10ウェイト2-1分割方式というドラゴンが出てくる必殺技のような奴。
素直にその技名を伝えればすぐに理解してくれたんだろうけど、下一桁がそうなっているから、それを抜いて番号を組み立ててほしいという部分を、テキストにすることが難しかった。これがうまく出来れば、実質9桁で勝負できるけど、うまく伝えられなかったので却下。
URLの中の一部を※※※として、※※※には137△△△△△△△という数字が並びます。
△は0000001~9999999が入るものです。これらのURLの情報を洗う事は可能ですか?
と聞くと、全然余裕とお答え。コードを修正してくれる。
だがよく聞けよ。初めから1000万のURLに総当たりするとやたら時間がかかるから、初めは100くらいでやってみろと言われて従う。
ところでどんな情報が欲しいのか聞かれたので、事業所名と事業所住所と加算についてですと答える。
実行OKとなったけど、結果はどこで見るんですか?と聞くと、Colubだったら左のあそこをクリックしたら見れるから。と言われ確認するとおお、なるほど。
だが結果としては何の情報も集まらなかったので、今回はこんな結果が出ました。今回はこんな結果が出ましたとお伝えすると、少しずつコードに修正を加えてくれる。
30回位良くない結果報告が続き、時間がとてもかかっていたのでこちらも少しイラっとする。無理なんですか?とかキレてみたりする。人任せ(AI任せ)も甚だしい事に気が付き、自分でそのサイトを開き、右クリックでページのソースを表示させ、自分が欲しい情報が書かれている周辺のHTMLをコピーして先生にお伝えすると、一気に修正精度が高まりだした。
初めはそのページのHTML全てをコピーしてお伝えしていたが、そんな長いのは貼り付けられませんと言われたので、一部だけの貼り付けに変えたけれど、さすが大先生はそれでも理解してくれる。
そして20回くらいのやり取りで、とりあえず動くPythonコードが完成した。
あとで欲しい情報を追加したい時には、そこら辺のHTML貼り付けてくれれば追加するから。とか気軽にやさしくされた。惚れてまうやろ。
全部分投げで頭使わないでやるよりも、自分も考えて情報を提供していけば、それだけ大先生も早く仕事ができるので、やっぱりまだしばらくは、生成AIが強く出来てきても、人の能力の違いで内容や速度は違うんだろうなとおもう。
次は最終回のPythonの実行とかそういったことのまとめ