今更聞けないAIの作り方【AI用語解説その1】
ここ数年AIブームの話がちらほら聞かれ、最近でもAIの話を聞きたい、AIのエンジニアになりたいという声も上がっています。
しかし、AIがどのようにして作られているかご存知ですか?
AIを作りたい!作って欲しい!と言われても、できなかったり難しいかったりするケースが多いです。
実際に私もお断りしたケースもいくつかありました。
またAIのセミナーや記事を読んでも、専門用語ばかりでよくわかりませんよね?
そこでこちらの記事にAIがどのようにして作られるかいくつかまとめました。
AIとは
諸説があって定義が曖昧にはなっていますが、元は単に人間のように考える機械のことを指していました。
1950年代からは人の仕事を自動化するために研究されました。
今は機械学習といってデータを自動で分析する手法が用いられるのが主流です。
機械学習とは
大量のデータを機械学習という手法によって、データの関係を示すモデルと呼ばれるものを作る方法を言います。
機械学習の世界でよく言われるモデルのことがまさしくAIのことです。
データの関係性、つまりパターンや法則を自動で捉えることで、
・ Amazonがオススメの商品を教えてくれる
・ スマホのカメラから人の顔を捉る
などができます。
これらも機械学習の技術が使われています。
データの関係性?パターン?
例えば私が見るAmazonのページでは、統計や機械学習、プログラミングの本を探すことがよくあるので、画像のように表示されます。
これも機械学習によって
私と機械学習やプログラミングと関係がある
というモデルが出来た結果です
このように、モデルによって私とオススメの本の関係がパターン化されています。
ではデータのパターンや法則はどのように捉えるのでしょうか?
教師あり学習
機械学習でもよく使われている手法です。
動物を画像から識別したい!と言っても、画像を見せただけで「これは犬」「これは猫」と判断できる訳ではありません。
例えば、算数ドリルやセンター試験模試の問題と答えを一緒に見せるのが教師あり学習です。
ただし丸暗記はせずちゃんと足し算のやり方も覚えてくれます。つまり、与えられた問題から選択肢や数字を考えるようになる訳です。
犬と猫を画像から判別したければ、犬と猫の画像を「これが犬」「これが猫」という答えも一緒に見せてあげます。
「これが犬の画像」「これが猫の画像」と見せていくうちに画像と答えの関係性や犬と猫の違いを学び、どちらがどちらか考えられるようになります。
このように、教師あり学習の場合は、問題と正解のセットをAIに覚えさせる必要があります。これを学習と呼びます。
学習というステップを踏むからパターンが学べるのですね
教師なし学習
先ほどの教師あり学習と違って、答えを与えずにデータの関係性を捉えるだけの手法を言います。
よくクラスタリングという言葉を聞く方もいますが、こちらも教師なし学習です
ただし、教師ありと違って実用的なモデルができにくいです。使われ方としては
・ 単にデータの関係性を分析するのに使う
・ 分析結果を機械学習に応用する
といったところでしょうか?
ただし例外的に、商品のおすすめなどにはよく使われます。
例えば、オムツとビールが一緒に買われやすいという法則(オムツとビールの法則)という話があります。
これはアソシエーション分析という教師なし学習の一種とも言える方法で分析した結果です。
具体的には、オムツを買いに来たお父さんがついでにビールを買うことが多いという予測結果です。
これは、オムツとビールの買われたデータから関係を見つけ出されました。
Amazonや楽天市場なども、
似たような教師なし学習の一種を使って、
ユーザと商品の関係を自動で見つけだしています。
ひょっとしたらオムツを買い物かごに入れたお父さんはお酒もおすすめされているかもしれませんね
他にも自動運転にも使われている強化学習などといった手法も存在します
ディープラーニング
AIブームになってよく聞かれる単語ですね。
これも機械学習の一種で、人の脳に似たアルゴリズムをより複雑にしたもののことを言います。
ディープラーニングの技術によって、AIはより人間のような柔軟な予測が出来るようになりました。
・ アニメ絵や実在しない人の写真の自動作成
・ 車載カメラを使った自動運転
といった画像を使う場合や
・ コールセンターの会話
・ スマートスピーカー
・ チャットボット
といった人の話し言葉や音声に対して使われるのが特徴です。
ただしディープラーニングは万能ではないです。数字の分析や、商品のおすすめなどは、まだまだ苦手なようです。
よく「ブラックボックスで説明できない」と言われているのは機械学習の中でもディープラーニングです。
が、最近では中身を分析する技術も普及しています(参考記事はこちら。技術的な内容注意)
回帰分析もAIの一種!?AI時代には統計が必須
実は機械学習は統計手法の進化系です。統計分析に基づいている手法です。
その関係で、回帰分析も機械学習の一種とされることもあります。
そのため統計分析は機械学習の必須スキルともされています。
機械学習で作成したモデルがどうしてうまく動く保証があるかや、機械学習のモデルの精度を高める為にも統計学の知識は避けて通れません
まとめ
機械学習
・ 今のAI技術の主流で
・ 使いこなすには統計知識が必要
・ データの関係性のパターンを計算する
・ そのパターンを元に考える
・ 統計手法の発展形で、回帰分析も機械学習として扱われることも
ディープラーニング
・ 機械学習の一種で、人の脳を参考に作られた
・ 画像・文章・音声が得意
・ 複雑でないデータは苦手
教師あり学習
・ 算数ドリルやセンター模試のように答えのあるものを学習
・ 答えとの関係性を学び、答えを考えられるようになる
教師なし学習
・ 答えがなくても、データの関係性を見つけてくれる
・ 教師あり学習よりも弱いため、データ分析に使われるのがメイン
・ 商品のおすすめに実用されている例もある
機械学習で成功するには?
最近ではAIエンジニアでなくても、AIが作れるようになりつつあります
例えば、AutoMLという機械学習のアルゴリズムを知らなくても、機械学習を扱えるようなサービスが現れています。
確かにAutoMLでも統計知識が必要ですが、その前にAutoMLで何ができるかを知るために試しに使ってみてもいいと思います
よりIT知識がある方へ
最近のAIは機械学習という方法で作られています。しかし機械学習で気をつけるべき点を知らないと、AutoMLを使ってもAI開発に失敗します。
そこで、機械学習がうまく行く方法とうまくいかない方法についてまとめました。
有料ですが、ITの知識がある方なら読める記事になっていますのでこちらもおすすめです。
よくわからないから作ってほしい!相談したい!という方へ
ITについては全然わからないけど、是非とも使ってみたい!という方は以下から個人的にコンサルティングのお問い合わせ受け付けております
【お問い合わせはこちらから】
また、私の経歴と実績はこちらでご覧いただけます。
気になる方はこちらからご覧ください。