見出し画像

【単元別_100問】AWS認定AI プラクティショナー[AIF-C01版]の過去問・類似問題_Fundamentals of AI and ML


はじめに

本記事は、最も効率的にAWS認定AI プラクティショナー[AIF-C01版]を合格したい人に向けた記事です。

AWS AIプラクティショナーは、AWSのAIサービスや機械学習の基本的な知識を問う試験で、5つの主要カテゴリに分類されています。

合計85問のうち、合格点は概ね7割(60問正解)ですので、各カテゴリのうち比重の大きな出題範囲を確実に固めるのが合格への最短距離です。

そのため、満遍なく対策するのではなく、割合が最も大きいカテゴリから優先的に学習を進めるための教材を作成しました。

カテゴリ別の出題傾向


AWS AIプラクティショナー試験の設問割合を見ると、以下のカテゴリが他と比較して大きなウェイトを占めていることが一目瞭然です。
・Applications of Foundation Models
・Fundamentals of AI and ML

本Noteでは、Fundamentals of AI and MLのカテゴリで最頻出の問題に絞って問題集、解説を作成しておりますので、下記の方はぜひご活用頂ければと思います。

■対象者
・初学者で効率的に学習を進めたい方
・既に学習を進行しており、Fundamentals of AI and MLのカテゴリが苦手と特定できている方

各カテゴリの内容(参考)

こちらは各カテゴリの概要です。

  1. Fundamentals of AI and ML

    • AIと機械学習の基礎的な概念を理解することを目的とします。

    • 機械学習モデルの仕組みやトレーニングの基本、AIの歴史などが含まれます。

  2. Fundamentals of Generative AI

    • 生成AIの理論と応用について学びます。

    • GANや拡散モデルなど、画像やテキスト生成技術の基本を理解することが目標です。

  3. Applications of Foundation Models

    • 近年注目されている大規模言語モデル(LLM)や、Amazon Bedrockを活用した実世界での応用例に焦点を当てます。

    • 特に企業でのカスタマイズや、特定ユースケースにおける活用方法が試験で問われることがあります。

  4. Guidelines for Responsible AI

    • AI利用時の倫理的側面や、責任あるAI設計・運用に関するベストプラクティスについて理解することを目的とします。

  5. Security, Compliance, and Governance for AI Solutions

    • AIソリューションを設計する際に必要なセキュリティおよびコンプライアンスについての知識を問います。


下記の練習問題をマスターすれば、Fundamentals of AI and MLのカテゴリの内容はほぼ網羅できるはずです。
初めの5問を無料開示いたしますので、クオリティに応じて購入判断を頂ければと思います。

練習問題 100問


問題1
小売業者が顧客データを基に購入傾向を予測するAIモデルを構築しています。データの欠損値除去、変数のスケーリング、そして顧客属性の分布分析など、データ前処理を効率的に行う必要があります。この作業に最適なAWSサービスはどれですか?
a. Amazon Athena
b. AWS Glue DataBrew
c. Amazon SageMaker Feature Store
d. Amazon SageMaker Data Wrangler

正解: d. Amazon SageMaker Data Wrangler

解説
Amazon SageMaker Data Wranglerは、データのクリーニング、変換、特徴量の分析を効率的に実施できる統合ツールです。特に、欠損値の補完や変数のスケーリング、分布分析といった機械学習モデルの前処理作業をサポートします。Data Wranglerを利用すれば、データの準備を簡素化し、AIモデルのトレーニングにスムーズに移行することが可能です。また、他のAWSサービスとも統合されており、分析結果をモデル構築プロセスに即座に反映できます。
他の回答の解説
a. 「Amazon Athena」:データクエリ用のサーバーレス分析ツールであり、データ前処理には不向きです。
b. 「AWS Glue DataBrew」:データ準備を支援しますが、SageMakerとの統合を考慮する場合、Data Wranglerがより適しています。
c. 「Amazon SageMaker Feature Store」:特徴量管理に特化したツールであり、データ前処理全般をサポートするわけではありません。
参考: AWS - Data Wranglerの使用方法

問題2
製造業の企業が、機械学習を利用して製造工程の異常を検知するシステムを構築しています。このシステムでは、データ取り込みからモデルの再トレーニング、異常検知モデルのデプロイまでを反復的に行い、継続的に改善する必要があります。このプロセスを一貫して自動化するために採用すべきMLOpsの実践手法はどれでしょうか?
a. 分析ダッシュボードの作成
b. 継続的インテグレーションおよびデリバリー(CI/CD)
c. ユーザーインターフェースのカスタマイズ
d. データベースクエリの最適化


正解: b. 継続的インテグレーションおよびデリバリー(CI/CD)
解説
CI/CDは、データ取り込み、モデルのトレーニング、評価、デプロイまでを自動化するプロセスを確立する手法です。製造業の異常検知モデルでは、新しいデータが入手されるたびにモデルを再トレーニングし、最新の情報を反映したモデルを迅速に展開する必要があります。これにより、効率的で一貫性のあるプロセスを構築でき、異常検知の精度と信頼性が向上します。AWS CodePipelineやAmazon SageMaker Pipelinesを利用すると、MLワークフロー全体を自動化できます。
他の回答の解説
a. 「分析ダッシュボードの作成」:結果を可視化するのに役立ちますが、MLプロセス全体の自動化には直接関係しません。
c. 「ユーザーインターフェースのカスタマイズ」:ユーザー体験を向上させるための手法ですが、モデルの反復プロセスには影響を与えません。
d. 「データベースクエリの最適化」:データベースのパフォーマンス向上に有用ですが、MLOpsのプロセス自体を自動化するものではありません。
参考: AWS - MLOpsとCI/CDの概要

問題3
オンラインマーケットプレイスがレコメンデーションエンジンを開発し、顧客体験の向上を目指しています。このシステムがユーザーの期待にどれだけ応えているかを測定するため、長期的なビジネスメトリクスとして最も適している指標はどれでしょうか?
a. トランザクションごとの成功率
b. クラスタリング精度スコア
c. AUC-ROC(受信者動作特性曲線下の面積)
d. 顧客フィードバック


正解: d. 顧客フィードバック
解説
顧客フィードバックは、ユーザー体験や満足度を直接的に測定する最も重要なビジネスメトリクスです。レビュー、NPS(Net Promoter Score)、CTR(Click-Through Rate)などの指標を追跡することで、システムが提供する価値と顧客の期待に応えられているかを評価できます。このデータは、長期的な顧客維持率やロイヤリティ向上に直結するため、特にマーケットプレイスのようなビジネスモデルにおいて重要です。
他の回答の解説
a. 「トランザクションごとの成功率」:一部の成功指標は提供しますが、全体的な顧客満足度には直接関与しません。
b. 「クラスタリング精度スコア」:内部分析には有用ですが、顧客体験を直接測定するものではありません。
c. 「AUC-ROC」:モデルの性能を測定する技術的な指標であり、ユーザー体験や長期的な影響を測定するには不適切です。
参考: ビジネスメトリクスの活用方法

問題4
保険業界で、顧客解約率(チャーン)を予測するAIモデルを構築したいと考えています。この目的に最適なアプローチはどれでしょうか?
a. 一般的な事前学習済みのモデルをそのまま使用する
b. オープンソースモデルを少し修正して使用する
c. 自社独自の顧客データを利用してモデルをゼロから訓練する
d. 事前に収集された公開データセットのみを使用する


正解: c. 自社独自の顧客データを利用してモデルをゼロから訓練する
解説
顧客解約率の予測には、特定の業界や企業に固有のデータパターンを考慮する必要があります。そのため、自社の顧客データを使用してカスタムモデルを訓練することが最適です。このアプローチにより、モデルは企業の特定のデータセットに適応し、より正確な予測が可能になります。AWS SageMakerなどを活用することで、トレーニング、ハイパーパラメータ調整、デプロイまでのプロセスを効率化できます。
他の回答の解説
a. 「一般的な事前学習済みのモデルをそのまま使用する」:汎用モデルでは特定の企業データに最適化されないため、精度が低くなる可能性があります。
b. 「オープンソースモデルを少し修正して使用する」:データの特異性を十分に反映できないため、不正確な予測になる可能性があります。
d. 「公開データセットのみを使用する」:公開データセットは一般化されていますが、自社のニーズに対応するには不十分です。
参考: Amazon SageMakerを活用したカスタムモデル構築

問題5
新薬開発プロジェクトで、2つの異なるAIモデルを用いて疾患分類を行っています。それぞれのモデルが異なる閾値での精度を示すため、全体的な性能を評価したいと考えています。この目的に最も適した指標はどれでしょうか?
a. 特定のカテゴリに対する正解率(Precision)
b. コスト効率分析(ROI)
c. 受信者動作特性曲線下の面積(AUC-ROC)
d. 単純な正解率(Accuracy)

ここから先は

51,977字

¥ 1,200

この記事が気に入ったらチップで応援してみませんか?