見出し画像

AI2nd#5ふりかえり(機械学習モデルの作成)


01 Day4ふりかえり質問回答

Q1

A1:個々のアルゴリズムについて、本日の講義で説明しますが、自分の困りごとを解決するために使うべきAIの種類を見分けられるようになってもらいたいと考えています。車に乗りたいってなったときに、どの車種を選択するのか(SUV、ミニバン、軽四)を選ぶように目的や道路状況などに合わせて考えることと似ていると思います。

Q2

A2:すでに受講者のみなさんは(とくに前回リアタイ受講したみなさん)は相当程度判断できると思います!本日は実践編でより血肉にしていきましょう。

Q3

A3:データ数を増やすことは、解決法の一つではありますが他にもアプローチ方法があるので、試行しながら近づけたらいいと思います。

Q4

A4:天気予報をイメージしてもらえればわかるように、機械のように大量のデータを同時に分析することは難しいので、人間の限界にならないシンプルなものをアウトプットすることとご理解ください。

参考図書内にある、ガスの修理業務について
電話オペレーターが現場に持っていく道具を推測して作業員に伝えていたが、AIに予測させてシステムを開発した事例が載っています。

02 機械学習を考えるにあたって(教師あり学習)

今日は機械学習の分け方について、どんな種類があるのかをざっくり覚えてもらえるのが目標です。(丸暗記しなくていいですよ)⇒安心

02-1 【分類】
りんごの例でわかるようなものがイメージをしやすいかと。
【分類】がりんごの合否判定のジャンルになります。

02-2 【回帰】
統計データから、「明日の気温予測は?」「17度です」
というように、数値を回答するものです。

どれが正解というのは決まってません

状況に合わせてどのように分類の考え方を使うのかを学んでいきましょう。
もちろん、使うモデルによっては合否判定が変わることもあります。

AIで試行しながら、都度分類方法を検索すると理解しやすいです。
(最新の情報についていけるというメリットもあります)

分類例:サポートベクターマシン

それっぽい線を引く分類方法!

赤い線が人間から見ると【適切】に見える。ロジックとしては、いい感じに2点のあいだに線を引く理屈です(偏微分方程式らしい・・・・うっ)
評価精度を数値で出すことができるので、それを基に適切なモデルを選定する。
活用事例:株価予測・災害予測・異常検知・倒産予測・顔検知
関係性のわかりやすいものに使いやすいイメージ)

クラスタリング例:kー平均法
詳しい計算法の詳細はここで紹介しませんが、クラスタリングを繰り返していく手法です。
活用事例:文書の分類・画像処理・異常検出など
似たものグループにわけることが得意なイメージ)

一概にデータをたくさん入れるから精度が一様に高まるわけではなく、考え方を変えることも含めていろいろな視点を持つことが大事です。

分類例2:決定木分析

条件で枝分かれさせる

人間側には使い勝手のいいモデルだが、ハマらなかったとき精度が高くない。わかりやすく振り分け項目を理解できるので、人間の判断で調整しやすい。

携帯電話の解約率について

どのように枝分け条件を設定するのか、細かい数値(通信量)などは機械の方で出してくれる。(数値の詳細も表示できる。)

回帰例:線形回帰

良い感じに各プロットからの距離が等しくなるような直線を求める

1つの説明変数↔1つの目的変数
の関係を求めるときに適しています

回帰例:重回帰分析

複数の説明変数↔一つの目的変数

いくつもの要素からなる目的変数に対して、どのような説明変数が影響を与えるのかを分析することに用いられます。
具体例:目的変数(家賃)=説明変数1(駅からの距離)+説明変数2(部屋面積)+・・・
⇒もちろんそれぞれの係数は物件ごとに違うのでどのように設定すれば適切な家賃で入居者が増えるかはまた別に検討する必要がある。

全ての仕組みを完全に暗記する必要はなく、どのように問題を解決したいのか、どの分析手法が解決に対して適切なのかを把握してもらいたいのです。
もちろん、どういった分析手法が向いているのかをAIに相談しながらすすめることも可能です。

02章まとめ カンパ先生

03 実技編

漠然とした指示をAIにしても、欲しい結果が返ってくるわけではありません。適切な情報を与えないと、適切な判断をするための答えが返ってきません。

Q:講義資料のスライドデータをいただけませんか?
A:当然技術的には可能なのですが、しません。スライドデータをもらってしまった受講者の方が「教科書」のように永遠に変わらない資料のように扱われることを恐れています。そうしたことは「リスク」になります。
VUCAの時代では、講義資料の内容だって古い情報になっていきます。

人間はあっという間に忘れる!

必要な情報は、都度調べたほうが確実に正しい情報にリーチできます。


さて、実技コーナーです。データをもとに分析をすることを始めます。
テーマは「お弁当の需要予測」です。

無料サイトより


CSVでダウンロードしましょう
yが目的変数(一般的)

最近出てきたDeepSeekを使います。
(現在使える無料版のAIでは断トツの性能の中華製AI)

中華製といえば、定番の質問にも
「すみません、知りません」と答えてくれますw

今からデータ分析をします。機械学習を使ったデータ分析をします。どういうものかというと、あるお弁当屋さんの売上の個数の予測をしたいと考えています。それにあたって約一年分の売上のデータがあります。おっていかに最初の数量分のデータはありますが気候の情報やメニューカロリーなどのさまざまな情報が入っています。手始めに気温の情報は関係があると考えているので、気温の情報を基に売上個数を算出するモデルを作ってもらいたいです。Googleコラボの上でPythonで動かすことを想定しています。一連のコードを書いてもらえますか。datetime y week soldout name kcal remarks event payday weather precipitation temperature
2013-11-18 90 月 0 厚切りイカフライ 快晴 -- 19.8
2013-11-19 101 火 1 手作りヒレカツ 快晴 -- 17
2013-11-20 118 水 0 白身魚唐揚げ野菜あん 快晴 -- 15.5
2013-11-21 120 木 1 若鶏ピリ辛焼 快晴 -- 15.2
2013-11-22 130 金 1 ビッグメンチカツ 快晴 -- 16.1
2013-11-25 135 月 1 鶏の唐揚 曇 -- 14.6

最初のプロンプト

データの入力エラーなどを乗り越えた第1弾の出力

寒い方が売れる傾向か!

さらに、翌日の気温を入力した場合の売上予測個数も出せるようにしてみました。

他の受講者の方のように図示はできてない・・・

04 復習

2周目見ながらちょこちょこ作業してみました!
修正に手間がかかっているので、プロンプトの精度を上げることが大事だというのが体感できました。
(違和感を正確に伝えること、正解イメージをしっかり伝わる様に伝えること)

まだエラーありますが・・・


いいなと思ったら応援しよう!