教師あり学習について by新米部員T
こんにちは!経済学AI研究会 マシンエコノミクス新米部員のTです。
今まで代表や副代表が記事を執筆していたのですが、今回初めて記事を執筆します。
私はプログラミング歴も浅く、何より新米部員であります。この記事は、Python等の勉強を始めてまもない新米部員の私Tがデータ分析について勉強したことを基にして、いろいろ書いてみようという試みであります!
今回は教師あり学習について書いていきます。
教師あり学習はAIを作るときに使われる機械学習の手法の一つです。
教師あり学習ではまず、入力するデータと、その答えのペアになるデータを準備します。その後この二つのデータをコンピュータに読み込ませて「入力したデータから答えのデータを予測する法則」を発見させます。
その後は発見した法則を使って、コンピュータが迅速かつ自動的にデータを処理してくれるわけです。
分かりやすいかは分かりませんが例を考えてみました。
私Tは現在下宿中でして、自炊を良くしています。ですが僕の友達で自炊をしていない人は多いです。ある時スーパーでたまたま友人と会った時、僕がほうれん草を持つと、「小松菜美味しいよな~。」と言われて驚いたことがあります。しかし、教師あり学習を使えば小松菜とほうれん草をほぼ間違わないAIを作ることが可能です。
入力するデータはほうれん草と小松菜の写真にします。今回の正解のデータはほうれん草と小松菜のみです。これは入力するデータにほうれん草と小松菜しかないからですね。
(1)の写真―小松菜、(2)の写真―ほうれん草、…(1000)の写真―ほうれん草、という風に1000個のデータをコンピュータにぶち込むと、コンピュータは1000枚の写真の特徴を一生懸命勉強して、
「入力した、ほうれん草の写真のデータ」と「答えの、ほうれん草というデータ」
を結びつける法則を見つけるわけです。入力したのは小松菜のデータもありますから、小松菜も同様の法則を見つけます。
このほうれん草と小松菜を判断するデータがあれば、もう二度とほうれん草と小松菜を間違えない。というわけでは、実はないのです。
やはり、コンピュータも人間と同じように間違えます。この法則がどれぐらいの精度なのかを正解率として算出することが出来ますが、基本的に100%の正解率を持つ法則を見つけることは出来ません。この正解率を上げるためにいろんな工夫が必要なのです。
だから、AIは完璧ではない。ということがこの記事を読んだ方に伝われば幸いです。
これは余談になりますが、教師あり学習があるわけですから、教師なし学習もあります。今回は割愛しますが、興味のある方はこちらの記事をご覧ください。https://note.com/cute_minnow52/n/n184be183a016
以上新米部員Tが担当しました!