見出し画像

【AIによる予測】予測マシンの世紀#9 予測マシンはなぜ「知能」か?①

こんにちは。シンラボ共同代表の草場です。

AIとの共同に関して、『予測マシンの世紀 AIが駆動する新たな経済』をまとめていきます。推理小説のようで、ドキドキワクワクです。

目次
はじめに―機械知能
安さはすべてを変化させる
第1部 予測(魔法の予測マシン;「知能」と呼ばれるわけ ほか)
 第3章 魔法の予測マシン
 第4章 「知能」と呼ばれるわけ
第2部 意思決定(決断を解明する;判断の価値 ほか)
第3部 ツール(ワークフローを分解する;決断を分解する ほか)
第4部 戦略(経営層にとってのAI;AIがあなたのビジネスを変容させるとき ほか)
第5部 社会(AIと人類の未来)

本日から、予測マシンが「知能」と呼ばれるわけ、についてです。

■1部4章 知能と呼ばれる理由
昨日は、予測マシンが魔法のように見える、という点を見てきました。

では、予測マシンが「知能」と呼ばれる理由は何でしょうか?この4章のキーポイント(まとめ)は以下です。

キーポイント
・機械学習は統計学とは異なる目的を持っていた。統計学が平均的に正しいことを重視していたのに対し、機械学習の目的は、運用上の有効性であった。予測は、より良いものであればバイアスをかけることができた。これにより、科学者に実験の自由が与えられ、過去10年間に登場した豊富なデータと高速なコンピュータを活用した急速な改善が促進された。
・従来の統計的手法では、仮説の明確化、あるいはモデル指定のための人間の直感が必要とされる。機械学習は、モデルに何が入るかを事前に指定する必要性が少なく、変数間の相互作用がより多く、はるかに複雑なモデルに対応することができる。
・最近の機械学習の進歩は、人工知能の進歩と呼ばれることが多い。
(1)この技術に基づいたシステムは時間の経過とともに学習し、改善されていく
(2)これらのシステムは、特定の条件の下で他のアプローチよりも有意に高い精度の予測を行い、一部の専門家は予測が知性の中心であると主張している。
予測と知能の間のリンクについては不可知である。我々の結論は、予測の進歩が知能の進歩を意味するかどうかについての立場を取ることに依存していない。知能のコストの低下ではなく、予測のコストの低下の結果に焦点を当てていく。

それでは細かく見ていきます。

始めに人工知能の歴史から入っています。1956年、いわゆるダートマス会議が開催されました。

コンピュータがゲームをしたり、数学の定理を証明したりするような認知的思考に従事するようにプログラムできるかどうかが議論された。また、コンピュータが物事を説明できるように、言語とは何か、知識とは何か、ということを議論した。研究者たちは、AIの可能性を楽観視していた。

このころは、AIが知能を持つ可能性に関しても楽観しされていたようです。

ロックフェラー財団に資金を求める際、彼らはこう書いている。
「機械に言語を使わせ、抽象化や概念を形成させ、今まで人間にしかできなかったような問題を解決し、自分自身を向上させる方法を見つける試みが行われるでしょう。厳選された科学者のグループが一夏の間、この問題に一緒に取り組めば、これらの問題の一つまたは複数の分野で大きな進歩を遂げることができると考えています」

非常に楽観的ですね。しかし、ここからしばらくは、よく知られているようにAIの冬の到来です。

AIは翻訳の初期段階で進歩したが、それは遅かった。AIの研究は一般化に失敗した。1980年代初頭には、医療診断のような熟練した領域を再現するために、エンジニアが専門家システムを慎重にプログラムすることができるという希望がもたらされたが、これらは開発にコストがかかり、面倒で、無数の例外や可能性に対処することができず、"AIの冬 "として知られるようになった。

2012年、ディープラーニングによる「目」の獲得以降は、この冬が終わったように見えます。

より多くのデータ、より優れたモデル、強化されたコンピュータによって、最近の機械学習の発展は予測を改善した。ビッグデータの収集と保存の改善は、新しい機械学習アルゴリズムの原料となる。新しい機械学習モデルは、以前の統計的なモデルと比較して、より適切なプロセッサの発明によって容易になり、柔軟性が大幅に向上し、より優れた予測を生成するようになった。

例として、解約率の予測が挙げられています。企業にとって、顧客の獲得にはお金がかかります。そのため、解約によって顧客を失うことは、コストがかかります。保険・金融サービス・通信などのサービス産業では、解約を管理することが最も重要なマーケティング活動となります。

解約を減らすための最初のステップは、リスクの高い顧客を特定することだ。企業はそのために予測技術を利用することが出来る。

少しだけ数学的な話になりますが、一般的に、解約を予測するための中心的な方法は、「回帰」です。そのため、回帰技術の改善に焦点が当てられており、何百もの異なる回帰法を提案され、テストされました。

回帰とは?それは、過去に起こったことの平均値に基づいて予測をすることだ。例えば、明日雨が降るかどうかを判断するために必要なのが、先週の各日に起こったことだけだとしたら、平均値を使って推測するかもしれない。過去7日間のうち2日間に雨が降ったとすると、明日雨が降る確率は7分の2、と予測されるかもしれない。

正確さを上げるために、「条件付き平均」が用いられます。

例えば、あなたが北カリフォルニアに住んでいる場合、雨が降る確率は夏には低く、冬には高くなるという季節によって異なるという過去の知識があるかもしれない。冬の間は25%、夏の間は5%の確率で雨が降るとしたら、明日の雨の確率は平均15%だとは評価しない。明日が冬なのか夏なのかを知っているからだ.

この「季節を考慮すること」は、平均値を調整する方法の一つにすぎません。他にも、一日の時間帯、汚染、雲量、海面水温など、その他の利用可能な情報で平均値を調整することができます。さらに、一度に複数の条件をつけることも可能です。

今日雨が降ったら明日は雨が降るだろうか?
冬だ、西から200マイルのところで雨が降っている、南から100マイルのところで晴れている、地面が濡れている、北極海の温度が低い、南西から時速15マイルで風が吹いているなど、複数の条件を同時に設定することもできる。

さまざまな状況を考慮に入れることは可能ですが、例えば上記の7種類の情報の平均を計算すると、128通りの組み合わせがあります。

より多くの種類の情報を追加すると、指数関数的に多くの組み合わせが作成される。

この多くの情報を元に回帰を考える手法は、多変量回帰と呼ばれています。多変量回帰は、何十、何百、何千もの条件平均を計算する必要がなく、複数のものに条件をつける効率的な方法を提供していました。

回帰はデータを取り、予測ミスを最小化する結果を見つけようとし、"適合度 "と呼ばれるものを最大化する。

適合度に関しては、以下の記事がわかりやすいです。

本日はここまで。明日は回帰と機械学習の違いについてみていきます。

草場壽一
https://sinlab.future-tech-association.org/



いいなと思ったら応援しよう!

この記事が参加している募集