見出し画像

生成AIパスポート学習まとめノート

GUGA公認生成AIパスポートテキスト&問題集を参照しながらまとめノートを作成しました。こちらのテキスト&問題集の中で古い情報部分も最新のものに更新してまとめています。学習の参考にしていただけたら幸いです。

生成AIパスポート試験の申し込みは下記サイトよりお申し込みください
公式テキストもこちらで購入できるようになっています


生成AIパスポート学習まとめノート

1. AIとロボットの区別

AIとロボットは、しばしば混同されがちですが、明確な違いがあります。

AI (Artificial Intelligence) は、人間の知能を模倣したコンピュータプログラムであり、ソフトウェアとして存在します。
AIは、学習、問題解決、意思決定といった知的作業をコンピュータに実行させる技術です。
具体的な例としては、画像認識、音声認識、自然言語処理、機械翻訳などが挙げられます。

ロボットは、AIを搭載した機械であり、物理的な存在です。
ロボットは、AIの指示に基づいて動作し、人間が行うことが難しい作業や危険な作業を代行することができます。
例えば、工場での組み立て作業、災害現場での救助作業、医療現場での手術支援などが挙げられます。

簡単にまとめると、AIは「知能」そのもので、ロボットはAIの「知能」を活用して動作する機械と言えます。
AIは、ソフトウェアとして存在し、ロボットはハードウェアとして存在する点が大きな違いです。

2. AIの歴史と現在

AIの歴史は、1956年のダートマス会議に遡ります。
会議では、人工知能という用語が初めて提唱され、AI研究の基礎が築かれました。
その後、AI研究は大きく3つのブームと冬の時代を経てきました。

  • 第一次AIブーム (1956年〜1970年代前半)

    • ルールベースシステムを用いた、探索や推論などの研究が盛んに行われました。

    • しかし、複雑な問題に対しては不向きであることが明らかになり、ブームは急速に終息しました。

  • 第二次AIブーム (1980年代後半〜1990年代初頭)

    • 専門家の知識をコンピュータに組み込んだエキスパートシステムが注目を集めました。

    • しかし、知識の管理や取り込みに課題があり、ブームは終息しました。

  • 第三次AIブーム (2010年代以降)

    • ビッグデータの活用とディープラーニング技術の発展により、AIは飛躍的な進歩を遂げました。

    • 画像認識、音声認識、自然言語処理など、様々な分野で実用化が進んでいます。

現在、AIは私たちの生活の様々な場面で活用されています。
自動運転車、音声アシスタント、スマートスピーカー、AI翻訳、AIチャットボットなど、AIは私たちの生活をより便利で豊かにする可能性を秘めています。

3. AIの知能の仕組み

AIに知能をもたらす仕組みは、大きく分けるとルールベース機械学習の2つの手法があります。

ルールベースは、人間が事前に作成したルールや知識をコンピュータプログラムに組み込むことで、
それに基づいて予測や判断を行う技術です。
例えば、会計ソフトウェアによる税の計算や、交通信号の制御システムなどが典型的な例です。

機械学習は、コンピュータ自身がデータからパターンを学習し、
その学習結果に基づいて予測や判断を行う技術です。
人間がルールを明示的に記述する必要がなく、複雑な問題に対しても柔軟に対応できます。
機械学習には、教師あり学習、教師なし学習、強化学習といった様々な手法があります。

  • 教師あり学習:入力データと正解データのペアを与えてモデルを学習させます。

  • 教師なし学習:入力データのみを与えて、モデルが自らデータからパターンを発見して学習させます。

  • 強化学習:試行錯誤を繰り返すことで、報酬を最大化する行動を学習させます。

現在では、機械学習、特に深層学習が主流となり、AIは様々な分野で活用されています。

4. ルールベース

ルールベースは、人間が事前に作成したルールや知識をコンピュータプログラムに組み込むことで、
それに基づいて予測や判断を行う技術です。
ルールベースは、明確なルールが定義できる問題、例えば、

  • 会計ソフトウェアによる税の計算

  • 交通信号の制御システム

  • チェスのゲームAI
    などに適しています。

メリット

  • ルールが明確なので、動作が予測しやすい

  • 開発が容易

  • メンテナンスが容易

デメリット

  • 大量のルールをプログラムする必要がある

  • 新しいルールを追加するのが難しい

  • 柔軟性に欠ける

ルールベースは、機械学習が登場する以前は主流でしたが、
複雑な問題や変化の激しい状況には対応しにくいという課題がありました。
そのため、近年では、より柔軟に対応できる機械学習が主流となっています。

5. 機械学習

機械学習とは、コンピュータがデータからパターンを学習し、その学習結果に基づいて予測や判断を行う技術です。
人間がルールを明示的に記述する必要がなく、複雑な問題に対しても柔軟に対応できます。
機械学習には、大きく教師あり学習、教師なし学習、強化学習の3つの種類があります。

教師あり学習は、入力データと正解データのペアを与えてモデルを学習させる方法です。
例えば、画像認識では、犬の画像と「犬」というラベル、猫の画像と「猫」というラベルを学習データとして与えます。
モデルは学習データから犬と猫の特徴を学習し、未知の画像が犬か猫かを判定できるようになります。

教師なし学習は、入力データのみを与えて、モデルが自らデータからパターンを発見して学習させる方法です。
例えば、顧客の購買データから、顧客をいくつかのグループに分類するクラスタリングや、データの次元を削減する次元削減などが挙げられます。

強化学習は、コンピュータが試行錯誤を繰り返すことで、報酬を最大化する行動を学習させる方法です。
例えば、ゲームAIでは、ゲームのルールと、勝利すると報酬を与えることで、AIはどのように行動すれば勝利できるのかを学習していきます。

機械学習は、近年では深層学習の発展とともに、様々な分野で活用されています。
画像認識、音声認識、自然言語処理、翻訳、自動運転など、機械学習は私たちの生活を大きく変える可能性を秘めています。

6. 教師あり学習

教師あり学習とは、入力データと正解データのペアを与えてモデルを学習させる方法です。
機械学習の手法の中でも、最も広く用いられており、様々なタスクに適用できます。

教師あり学習の例

  • 画像認識: 犬の画像と「犬」というラベル、猫の画像と「猫」というラベルを学習データとして与えることで、モデルは犬と猫の特徴を学習し、未知の画像が犬か猫かを判定できるようになります。

  • スパムメール判定: スパムメールと正常なメールのペアを学習データとして与えることで、モデルはスパムメールの特徴を学習し、未知のメールがスパムかどうかを判定できるようになります。

  • 自然言語処理: 文章と、その文章の意味を表すラベルを学習データとして与えることで、モデルは文章の意味を理解し、未知の文章の意味を解釈できるようになります。

教師あり学習のメリット

  • 高い精度: 正解データに基づいて学習するため、高い精度が期待できます。

  • 様々なタスクへの適用: 画像認識、音声認識、自然言語処理など、様々なタスクに適用できます。

教師あり学習のデメリット

  • 大量のデータが必要: 高い精度を得るためには、大量の学習データが必要です。

  • ラベル付けが大変: 学習データのラベル付けは、人手で行う必要があり、時間とコストがかかります。

  • 過学習: モデルが学習データに過度に適合し、未知のデータに対してうまく対応できなくなる場合があります。

過学習を防ぐために、正則化やドロップアウトといった手法が用いられます。

7. 教師なし学習

教師なし学習とは、入力データのみを与えて、モデルが自らデータからパターンを発見して学習させる方法です。
教師あり学習では正解データが必要ですが、教師なし学習では正解データは必要ありません。
そのため、教師あり学習よりもデータ収集が容易で、様々な場面で活用できます。

教師なし学習の例

  • クラスタリング: 顧客の購買データから、顧客をいくつかのグループに分類します。

  • 次元削減: 高次元のデータを低次元のデータに変換します。

  • 異常検知: 正常なデータから外れた異常なデータを検出します。

教師なし学習のメリット

  • データ収集が容易: 正解データが不要なので、データ収集が容易です。

  • 新たな発見: 人間が気づかなかったデータのパターンを発見することができます。

  • 様々なタスクへの適用: クラスタリング、次元削減、異常検知など、様々なタスクに適用できます。

教師なし学習のデメリット

  • 精度の評価が難しい: 正解データがないため、学習結果の精度を評価するのが難しいです。

  • 解釈が難しい: 学習結果が複雑で、解釈するのが難しい場合があります。

教師なし学習は、データから新たな知見を得るための手法として、様々な分野で活用されています。

8. 強化学習

強化学習とは、コンピュータが試行錯誤を繰り返すことで、報酬を最大化する行動を学習させる方法です。
強化学習は、環境との相互作用を通して学習するという点で、教師あり学習や教師なし学習とは異なります。

強化学習の例

  • ゲームAI: ゲームのルールと、勝利すると報酬を与えることで、AIはどのように行動すれば勝利できるのかを学習していきます。

  • ロボット制御: ロボットが目標を達成するために、様々な行動を試しながら、最適な行動を学習していきます。

  • 自動運転: 自動運転車が、様々な状況下で安全に走行するために、最適な運転方法を学習していきます。

強化学習のメリット

  • 柔軟性: 環境が変化しても、適応することができます。

  • 人間が介入しなくても学習: 人間がルールを明示的に記述する必要がなく、AIが自ら学習します。

強化学習のデメリット

  • 学習時間が長い: 試行錯誤を繰り返すため、学習時間が長くなる場合があります。

  • 最適な行動が保証されない: 常に最適な行動を学習できるとは限りません。

強化学習は、複雑な問題や変化の激しい環境に対応できる技術として、注目されています。

9. 半教師あり学習

半教師あり学習は、少量の正解データを用いて、大量のラベルのないデータを効率的に学習させる方法です。
教師あり学習と教師なし学習を組み合わせた手法であり、両方のメリットを活かせる点が特徴です。

半教師あり学習の例

  • 画像認識: 少量のラベル付き画像と、大量のラベルなし画像を用いて、モデルを学習させます。

  • 自然言語処理: 少量の翻訳済みの文章と、大量の翻訳されていない文章を用いて、モデルを学習させます。

半教師あり学習のメリット

  • データ収集の効率化: 全てのデータにラベルを付ける必要がないため、データ収集が効率的です。

  • 教師あり学習よりも高い精度: 少量の正解データを用いることで、教師あり学習よりも高い精度が期待できます。

半教師あり学習のデメリット

  • ラベル付けの偏り: ラベル付けに偏りがあると、学習結果に偏りが生じる可能性があります。

  • 精度評価の難しさ: 全てのデータにラベルがないため、学習結果の精度を評価するのが難しいです。

半教師あり学習は、データが不足している場合や、ラベル付けにコストがかかる場合に有効な手法です。

10. 過学習

過学習とは、モデルが学習データに過度に適合し、未知のデータに対してうまく対応できなくなる現象です。
機械学習では、学習データと異なるデータに対しても高い精度で予測することが重要ですが、
過学習が発生すると、学習データに特化したモデルとなり、汎化性能が低下してしまいます。

過学習が発生する原因

  • 学習データの不足: 学習データが少なすぎると、モデルが学習データの特徴を過度に学習してしまいます。

  • 学習データの偏り: 学習データに偏りがあると、モデルは偏った特徴を過度に学習してしまいます。

  • モデルの複雑さ: モデルが複雑すぎると、学習データに過度に適合しやすくなります。

過学習を防ぐ方法

  • 正則化: モデルのパラメータの値を小さく抑えることで、過学習を防ぎます。

  • ドロップアウト: 学習中に、ランダムにニューロンを無効化することで、過学習を防ぎます。

  • データの増強: 学習データを増やすことで、モデルの汎化性能を向上させます。

過学習は、機械学習モデルの精度を低下させるため、様々な手法を用いて防ぐ必要があります。

ここから先は

21,963字

¥ 500

もしよろしければサポートお願いいたします♡いただいたサポートの一部は献血や骨髄ドナー支援活動として寄付させていただきます!!