AI育成講座【day5】

あだむ

2025年1月23日 23:37

教師あり学習の分類
回帰や分類に分けられる。

・分類

どこかで分類する線を引くもの。使い勝手が良さそう。

以下chatgptより

サポートベクターマシーン（SVM）は、機械学習の一種で、データを分類するときに**「最適な境界線（超平面）」を見つけて分ける手法です。
特徴は、境界線とデータの間の「余白（マージン）」**を最大にすることで、新しいデータに対しても高い精度で分類できる点です。

例えば、猫と犬の画像を分類する場合、SVMは猫と犬のデータを最もはっきり分けられる線を探し出します。シンプルで強力な分類器としてよく使われます。

わかりやすい。どんか形であれ自分がわかれば良い。分かりやすい形で。

機械学習のデータ数と正解率の関係。必ずしもサンプルサイズが増えるからと言って、正解数が増えるわけではない。ある一定の漸近線が引かれており、そこに対して近づいていく可能性がある。したがって、サンプルサイズを増やす労力に対して正解率が必ずしも比例するわけではない。

木の枝のように、分類の枝を作っていく。これを見る限り、分類は簡易だが、確率が低そう。

・回帰

線形会議は直線的でわかりやすく、よく
使えるものであるが、外れ値に敏感であるため注意が必要。

非直線的なデータでも可能である。

例えば、小売店の売り上げ予測に使えるその日の天気や周囲でのイベント、交通量、当日の在庫、値段等等の複数の変数に依存した結果、売り上げの関係性を面で表すもの。

結論、今持ってるデータで何がしたいのかを理解し、それをChatGPTを使って説明することができれば、会計や分類など細かい分類を覚え必要ない。

例題
お弁当屋さんのデータをもとに、気温と売り上げの個数を予測する。

プロンプト
今からデータ分析します。機械学習を使ってテスト分析をします。上記のデータをもとにお弁当屋さんの売り上げコースを予測します。その上で様々なデータがありますが、今回は気温と売り上げ個数の関係を考えたいと思います。Googleコラボの上でPythonで動かすの考えています。このプロジェクトうまく進め、またコードを考えてください。売り切れは説明変数として考えます。

細かい説明を省くけど、ディープシークでやらせると、以下のようなグラフが出てきた。

これを見ると売り上げが少ない方は予測値が過大評価されてしまう。売り上げが多い方は予測値が過小評価の傾向にある。直線に近い点の集合は売り上げが60前後のものが多い。

こんな感じに気温と売り上げとソルドアウトの有無も含めてプロットできた。文字化けを直すのはなかなか難しい。

=== 予測結果 ===
入力気温: 15.0℃
予測売上個数: 115個

最終的に、このように過去の売り上げと気温の点のプロットから完全一致線を出した。そして気温から予想の売り上げ個数を出すグラフができた。

驚いたのは講義で概念や仕組みを理解するのは必要だと思う。
しかし、deepシークやChatGPTにコードまとめて書かせて、エラーコードをただ投げて出てきたグラフも投げて、こうしたいと言う意思をうまく使うことができれば、細やかな知識や能力をいらない。
いかに指示を正確にはっきり出すことが肝になってくる。

AI育成講座【day5】

・分類

・回帰

いいなと思ったら応援しよう！