BeautifulSoupを使って『吾輩は猫である』を読み込む
DataCamp の Intermediate Importing Data in Pythonコースを受講中です。
いよいよwebのデータを読み込むことができます!
Jupyter notebookで実行しても、同じ結果が得られます!
青空文庫の『吾輩は猫である』を読み込みました。
文字化け!!
BeautifulSoupの文字化けが止まらない時の解消方法 – Python
を参考にして、5行目のr.textをr.contentに変更すると
文字化けが直りました!
textはstr型(文字列)ですね。
吾輩を私に置換してみました。replaceは元の文字列は書き換えないので、新しい変数text2を用意しました。
これで読みやすくなるかな?
また、文中で「吾輩」は何回出てくるかも簡単に出ます。
483回だそうです!多い!