見出し画像

Day3 統計学入門〜統計とAIの意外な関係とは?〜

さて、AI人材講座のまとめと感想、day3いきましょう!
(だいぶ主観が入っているので、もし違うよという点があればお声かけください)

*スライドはすべて講座内のものをお借りしています

統計学とは、一言でいえば「データから有益な情報や知識を抽出し、それを意思決定や問題解決に活用する」学問です。

正直、僕も最初は「難しそう...」って身構えてしまいました。でも、講座を通じて、意外とシンプルな考え方なのかもって気づいたんです。

例えば、SUNABACOのチェックインの時間帯や曜日のデータを取って、イベントの開催日を決めるとか逆にやらない日を決めるとか。

データって、最初は単なる数字の羅列なんですが、そこに意味を持たせることで「情報」になり、それを活用することで「知識」になっていく。

実は世界の時価総額ランキングのトップは、ほとんどデジタル企業なんですよね。なぜかって?データに基づく意思決定ができるから。例えばAmazonやNetflixのレコメンド機能なんかは、徹底的にABテストを繰り返して改善されているわけです。

例えば僕は浜辺美波さんが好きなので、ちょいちょいNetflixの作品を見ているのですが、視聴したあとに「うたのん、他にも浜辺ちゃんがでてるこんな素晴らしい作品があるよ、どうよ?」と激しくレコメンドされます(笑)

色々なテストを繰り返して、ユーザーの滞在率が上がるように設計しているんですよね(涙

統計学の実践的な活用例:コレラと統計

講座の中で特に印象的だったのが、19世紀ロンドンでのコレラ対策の話です。

ジョン・スノウという医師が、実際に足を使ってデータを集め、水道会社の違いによって死亡率が大きく異なることを発見したんですね。上流の水を使う水道会社Bの方が、水がきれいで死亡率が低かった。

これって、すごく実務に紐づいているんと思うのです。当時の医者たちは知識が豊富すぎて、経験や直感を信じすぎていた。でも、素直にデータを集めて分析することで、真実が見えてきた。

僕もブログ運営とかアフィリエイトやってて、似たような経験あります。先入観を捨てて、データを見てみると、意外な発見があったり。

中央値と平均値の違い

統計の基本的な概念として、中央値と平均値の違いも学びました。

・100人いたときの50番目の人が中央値
・100人の和を100で割ったものが平均値。

これって、実はすごく重要な違いなんですね。

例えば年収のデータなんかを見るとき、平均値だと一部の高額所得者に引っ張られて実態と違う印象になることもある。そういう時は中央値で見た方が実態に近いことが多い。

この視点は、今後リサーチとかマーケティングする時にも活かせそうです。

仮説検定と推定の違い

統計には大きく分けて「推定」と「仮説検定」という2つの重要な手法があります。

推定は、限られたデータから全体像を予測する方法。例えば、選挙の出口調査なんかがそうです。

一方、仮説検定は、データから仮説が正しいかどうかを判断する方法。講師のいずくね先生によると実は、仮説検定の方が実務では圧倒的によく使われるそうです。1:9くらいの比率だとか。

面白いのが台風の進路予報図。あの円は実は「95%信頼区間」を表していて、台風の中心がこの円の中に入る可能性が95%あることを示しているんです。これを知った時は「へぇ~!」って思いましたね。

データ収集と分析の実際


仮説検定のなかの、ランダム化比較試験(RCT)の例として、新薬の効果検証の話がありました。グループを2つに分けて、一方には新薬を、もう一方には偽薬を与える。このとき大切なのは、いきなり仮説を立てないこと。

というのも、自分がこうじゃないかという思い込みは、事実をつかむことをかなり妨げてしまうんです。まずはデータを集めて、その中から傾向を探っていく。

これ、僕がアフィリエイトやってた時も同じことを感じました。「これは絶対売れる!」って思った商品が全然ダメで、逆に「売れ筋というデータにモドづいて紹介」ってやった紹介した商品がきちんと売れたり。

AIの本質:関数としての理解

講座の後半では、AIの本質について学びました。実は、AIって「関数」として理解するのがすごく分かりやすいんそうです。

例えば、りんごの画像を入力(インプット)すると、「合格」か「不合格」という判定(アウトプット)が出てくる。この「何かしらのインプットがあって、何かしらのアウトプットがある」という構造が、AIの基本なんです。

人間の仕事も同じように、インプットとアウトプットの関係で捉えることができます。AIは、その仕事の流れを模倣しようとしているわけですね。

実務への活かし方

統計とAIの知識は、実務でもめっちゃ活用できそうです。例えば、SEOの効果測定。「このキーワードで上位表示されるようになったから、アクセスが増えた」なんて、なんとなく思っていたことを、データで実証できる。

あとは、画像生成AIの活用方法も、インプットとアウトプットの関係で整理すると、より効率的な使い方が見えてきます。画像プロンプトも、結局は「どんなインプットを与えれば、望むアウトプットが得られるか」を考えることですからね。

データドリブンな意思決定の重要性

デジタルって聞くと冷たい感じがするかもしれません。でも、その向こう側には必ず人がいる。デジタルや統計を扱うことで、実はもっと人間に優しい社会をつくることができるんです。

例えば、A/Bテストで「このボタンの方が押しやすい」とか「この文言の方が分かりやすい」って改善を重ねていく。一見、機械的な作業に見えるかもしれませんが、それって結局のところ「人にとって使いやすい」ものを作っていく過程なんですよね。

講座を通して、統計学やAIって、決して冷たい技術じゃないってことを実感しました。データに基づいて意思決定することで、むしろ人間にとってより良い社会を作ることができる。

単なる「勘」や「経験」だけじゃなくて、ちゃんとデータで裏付けを取りながら進めていくことの大切さを、改めて学べた気がします。

統計とAIを学んで、新しい可能性が見えてきた!

統計学って、正直最初は「頭のいい人が理論武装して、はい論破ってしてくるやつでしょ?」って思ってました(苦笑)。

でも、今回のSUNABACOのAI人材育成講座を受けて、印象がだいぶ変わりました!

例えば、コレラの大流行時代に、ジョン・スノウが足を使ってデータを集めて、水道会社の違いで死亡率が変わることを発見した話。統計学って、実は人の課題を解決するための、すごくあたたかい学問なんですよね。

それから、AIの本質は「関数」だっていう話も改めて納得でした。インプットがあって、アウトプットがある。例えば、りんごの画像を入れたら「合格」「不合格」を判定する。シンプルに考えると、人の仕事も同じような「インプット→アウトプット」の形なんです。

これ、僕が今やってるSEOとか、商品の画像生成とかにもなんとか応用できるのかな? ただ闇雲にやるんじゃなくて、まずはデータをしっかり集めて、統計的に「これって本当に効果あるの?」って検証していく。

小さく試せる時代だからこそ、統計とAIの力を借りて、新しいことに突き進んでいきたいですね。

まずは自分の周りの「なんとなくそう思ってる」っていうことを、言語化してきちんとデータで示すところから始めてみようと思います!

いいなと思ったら応援しよう!

うたのん@銀行員➡︎ニート
いただいたサポートは、さらなる記事充実のための書籍購入費用などに当てさせていただきます! オススメの本などぜひ教えてくださいね☆o(≧▽≦)o