見出し画像

AI育成講座【day3】

当直だったので遅れて視聴。

振り返りに
「プログラミングの知識は必要ですか」等の質問があった。

この講座ってそもそも

プログラミングやAIを使えるようになろう。
ではなく

問題解決の過程でAIを使っていこう
である。

だから小手先のテクニックを磨いて全部を完璧にできるようにする必要はない。

全体像を掴みつつ、自分の位置を理解して
必要に応じて必要な時に必要な知識をつけることであると思う。

本章 統計学


ChatGPTのベースである統計学を理解することが重要。

統計学は、主観的な考えやバイアスを除いて、標準的な判断、意思決定できるツール。エゴを殺して殺して殺しまくる。

ChatGPTが統計学であるのであれば、僕たちはChatGPTと会話していく中で、間接的に統計学とツールを使って標準的である意味、プロフェッショナルの直感のようなものを文字や数字としてバイアスなしに認識できるツールであるのかな。

確かに、数字があると具体性や説得力が増す。
だからこそ、統計学を理解して数字に騙されないように数字に味方につけることが必要。

死亡原因の割合


年収分布

上記の2つの図は、有名上の1つは絶対すると、割合の話。
下の図は、平均値中央値はずれ値の考え方。

考え方を理解しないとミスリードされちゃうし、誤った認識を得てしまう。


推定と仮説検定

推定:小さい情報から全体を予測する手法。

ChatGPTを使って以下の推定を行ってもらう。

新規商品を開発しています。アンケートを取りました。 このデータから推定のステップにしたがって、推定を実行してください。 # データ アンケート結果: 3, 4, 4, 2, 5, 3, 5, 5, 2, 4 # 推定のステップ 1, 母平均を出す 2, 95%信頼区間を出す

結果

“1. 母平均: **3.7** 2. 95%信頼区間: **(2.87, 4.53)** この結果から、アンケートの平均的な回答は3.7であり、95%の信頼度で平均値は約2.87から4.53の範囲内にあると推定されます。 ​​”

標本が少ないので、95%信頼区間が広くてまだ使えない。
当然、標本集団が増えれば増えるほど、母集団の推定の信頼性が増すので、信頼区間は狭くなる。


仮説検定:統計学において、ある主張や仮説がデータに基づいて正しいかどうかを検証する手法

ChatGPTを使って仮説検定をやってみる。

新しいワクチンが有効か検証したいです。

検定のステップに従って、仮説検定してください。


# データ
接種した集団の回復日数: 5, 8, 6, 5, 8, 8, 8, 8, 6, 8
接種していない集団の回復日数: 8, 9, 7, 10, 9, 7, 7, 7, 9, 8
# 検定のステップ
1, 帰無仮説、対立仮説の設定
2, 有意水準の設定
3, 検定方法を決める
4, p値を計算
5, 仮説の確からしさを確認

仮説検定結果

  1. 帰無仮説 (H0H_0): 接種群と非接種群の平均回復日数は等しい。
    対立仮説 (H1H_1): 接種群の平均回復日数は非接種群より短い。

  2. 有意水準: α=0.05\alpha = 0.05

  3. 検定方法: 独立2標本t検定(片側検定)

  4. 計算結果:

    • t統計量: t=−2.01t = -2.01

    • p値(片側検定): p=0.0149p = 0.0149

  5. 結論:
    p=0.0149p = 0.0149 は有意水準 α=0.05\alpha = 0.05 より小さいため、帰無仮説 H0H_0 を棄却する。対立仮説 H1H_1 を支持する。


まとめ:
新しいワクチンを接種した群は、接種していない群よりも平均回復日数が短いことが統計的に有意である(有効性が示唆される)。


東京を理解して満足するだけではなくて、東京日常的に使って自分なりの仮説検証を繰り返すことが自分の中に落とし込むと言う意味になるはず統計を理解して満足するだけではなくて、日常的に使って自分なりの
仮説検証を繰り返すことが自分の中に落とし込むと言う意味になる



関数は数字を入力して数字が出力される変数装置。
また、AIはある種のデータを数値として認識し、それを変換し、別の生成物を生み出す装置であると言う認識。
その一方で、AIを確率論であるから、確率論の中で物事のつながりを見つけて、予想変換出力する装置ってことか?


いいなと思ったら応援しよう!