見出し画像

AI2nd day3 統計学


day2 Q/A


・プロンプト作成のコツ:基本的に投げかける情報が少なくて困ることはあれど、多すぎて困ることはない。まずはできるだけ前提条件を詳細に伝える、その上でどのようなoutputをこちらが求めているかもしっかり言語化して伝えることが重要。
あるいは、chatgptに質問させてしまうことも1つ。「〜したいんだけど、そのために必要なことは何かな?」と。

・仕事は人間のinputとoutputの連続である。inputは視覚情報や聴覚情報など、あらゆるデータ。それらをもとに、都度判断している。その結果がoutput。これを観察してみることで要素ごとに分解し、一部をAIに行わせるというイメージ。

・chatgptの音声入力は有用。

day3 本題

統計学


統計学の考え方:データに基づいた意思決定ができることが目的。

データの活用について:

データの活用

データ、情報、知識はそれぞれ異なるということ。

例:ある施設では出入館の時にアプリを用いてチェックイン、チェックアウトを行っている。このとき、
入館/出館の時刻:データ
時刻をグラフや表にまとめてわかりやすくしたもの:情報
その情報を見ると、「平日は夕方〜夜の出入りが多い」「9〜10月に入館者が多い」といった解釈ができる:知識
9〜10月に入館者が多いのは、おそらく〇〇な理由からで:洞察
より多くの入館者数を増やす(9〜10月の入館者数を増やす、あるいはベースの入館者数を増やす)ためには××なアプローチが有効ではないか:知恵

まずはデータを集めることが必要。集めたデータをもとに情報を得て知識を手に入れ、解釈をする。そして洞察と知恵を作る。
そのうえで、仮説を立てる。そして仮説が正しいかどうかを検証する。
データを集めるための時間と、仮説を立てて実際に検証するための時間。作業時間としては、全体のうち前者が9割を占める。なぜなら、データは「使える形で」収集する必要があり、多くの場合は最初そういった形では残っていないから。

そしてこれらの作業を通じて重要なのは、
主観的な経験や感覚にとらわれず、エゴを殺して、客観的に状況を把握する力。これがなかなか難しい。

実際に検証するための方法(統計手法)


1:推定 限られたデータから全体像を把握する
例:ある新商品を開発、一部の人に商品アンケートを行った。そのアンケート結果は市場全体に適用できると判断してよいか?

母集団と抽出された標本

そこで出てくる概念が、母平均と信頼区間。
母平均:顧客候補となる対象全員(母集団)の平均値。
しかし現実的には全員のデータを集めることは不可能。そのため、抽出された標本のデータの平均をもって母平均を推定。

信頼区間:「母平均がこの範囲のどこかにあるか」を推定するための区間。
商品アンケートを行った結果、「商品の評価は10点満点中6〜7点の間に収まると95%の確信を持てる」となれば、これが95%信頼区間。
例えば、ある学校の生徒100人からデータを集めた結果、「平均身長が150cm~160cmの間にあると95%の確信を持てる」とわかった場合、これが信頼区間です。

信頼区間は、「標本をたくさん集めたら、95%の確率で母平均がこの区間に入る」という意味。

2:仮設検定 データから仮説が正しいかどうかを判断する

以下2つの仮説を立て、帰無仮説を否定する(棄却する)ことで、対立仮説が正しいかを判断。

帰無仮説:「何も変化がない」または「効果がない」という仮説。

対立仮説:帰無仮説に対して「変化がある」または「効果がある」という仮説。

以下にステップを示す。

ステップ1: 仮説を立てる

  • 例: 新しい薬が従来の薬よりも治療日数を短縮するかを調べたい。

    • 帰無仮説 : 新しい薬と従来の薬で治療日数の平均は同じ。

    • 対立仮説: 新しい薬のほうが治療日数の平均が短い。

ステップ2: 有意水準 (α) を設定

  • 通常、α=0.05(5%)とする。

  • 「偶然で結果が生じた可能性をどれだけ許容するか」を表す。偶然でこの結果が得られる確率が5%以下であれば、帰無仮説を棄却する。

ステップ3: p値を求める

  • p値は、帰無仮説が正しいと仮定した場合に、データが観測される確率を表す。

    • 例: p値が0.03なら、「帰無仮説が正しいとすると、今回の結果が偶然に起こる確率は3%」。

ステップ4: 帰無仮説を判断する

  • p値と有意水準を比較して結論を出す。

    • p≤α: 帰無仮説を棄却(効果があると判断)。

    • p>α: 帰無仮説を棄却しない(効果があるとは言えない)。

AIは関数の1つである

関数とは:何かしらのinputに対して、outputを出す変換装置。

例:y=2x-2という関数であれば、「x=1」というinputに対して「y=0」というoutputが出力される。

AIも同じである。何かを入力することで、何かが出力される。

ゆえに、AIも関数の1つ。この考え方は非常に重要。
これは先ほどの「仕事はinputとoutputの連続」という考え方につながる。
仕事を要素ごとに分解して、関数であるAIを用いてそれぞれのinputとoutputをAIに代替させていく。AIは関数という考え方の延長線上に、仕事へのAI導入/代替という考え方があるのだ。

いいなと思ったら応援しよう!