機械学習に関する記事で実例を挙げながら説明している良記事がありました
鈴木です。
pythonを使う=機械学習、AIを使う という印象があります。
機械学習を身近に扱う例を探していて、たまたま面白そうなサイト、というか記事を見つけました。
まずこちらの記事です。
pythonはスクレイピングをするときに活躍してくれます。そのスクレイピングを、実際にどのように扱えば良いのかを非常に面白く解説していて、最後まで読むことができました。
こちらの記事では、自分自身に映画をおすすめする、というテーマで進めていて、身近さとプログラミングが一緒にできていて非常におもしろい試みです。
映画は僕が普段ほぼ全く見ないので、このように自分と好みが似ている方の中から任意に選ぶ、なんなら最後までプログラムに選んでもらうというのも手であると思いました。
映画レビューのデータを大量に用意して、自分の好みに合わせて機械に自分が好きそうなものをおすすめしてもらうためのコードを作る過程を見れるのはとても面白いです。
続編、というかひとまとまりの後編がこちらでした。
すごく勉強になります。一度読んでみることをおすすめします。
自分へのおすすめを作る過程で、分布表やプロットを作っていて、その割合が見れるのも興味深かったです。
そもそも機械学習を身近に使うというのが大半の方にとって意味不明だと思うので、自分でも役立つというか興味が持てるテーマで進めるのはとても面白かったです。
最後にしっかりとデータからおすすめを作り上げられることができたのも非常に素晴らしかったです。良い記事でした。
このテーマでは映画だったので、同じくTwitterにかけるようなITにまつわるトピック、ニュースも同じ要領で探せるのではないかとも考えられます。
応用ができることはとても貴重なので、よーーーく読み返そうと思いました。
ちなみにスクレイピングがそもそも謎である方のために
こちらの本を用意しております。ぜひお買い求めください。
また、メルカリの出品価格データから、適正価格を分析する、という記事もとても面白かったです。
適正価格、というものの定義を決めるところから始まり、実際に売れるにはどの価格が良いのかを割合とともに決めることができます。こちらもスクレイピングによりデータを集めています。
どの記事もそうですが結論に入るまでに他のデータも集まるので、それらをみるのも興味深いです。
この記事だとルンバ以外の商品でも機械的な検索では引っかかってくるので、それをどのように省くのか、マックスとミニマム値はいくらかもスクレイピングとJupiter Notebookを使ってみることができます。
ふと思ったのですがpandasを使う際はJupiterを使うことが多いのでしょうか。あらゆるところで見る気がします。もしかしたら全然検討違いなことを言っているかもしれません。。その際は失礼しました。。
機械学習やスクレイピングをするにあたって、やり方とともに実際の活用例を探せるのがとても面白かったです。このような記事をたくさん見つけるのも良いですね。
どうやって見つけようか考えた時にもやっぱりスクレイピングした方が良い気がしてきました。
書籍版も販売中です。