人工知能プロジェクトマネージャー試験対策 - ③-2:分野B:統計的理解 後編 -
こんにちは。
一般社団法人 新技術応用推進基盤 公式note編集局です。
私たちのnoteでは、AI・DX活用や新規事業の創出をテーマとして、技術と市場の両面について情報発信しています。
今回は、当団体が提供している資格試験「人工知能プロジェクトマネージャー試験」の「分野B:統計的理解」について、解説を行います。
本試験では、合格者像を下記のように定義しています。
近年、あらゆるビジネスでAIが活用されており、エンジニアに限らずAIに関する知識は必要不可欠になっています。しかしまだまだ、AIの裏側の仕組みや理屈について、イメージがつかない方も多いのではないでしょうか。
近年、Chat-GPTやGemini、Copilotなど、プログラミング不要の学習済みAIも多くあります。しかしこれらを自身の現場で活用するには、結局RAG(Retrieval Augmented Generation)の環境を作り、追加学習させねばなかなか実用に耐えません。現場のリーダーには、変わらずAIの仕組みを理解していることが求められます。
本試験でも、こうした技術的な理解のうち、統計的なもの分野B、プログラミング的なものを分野Cとして問うています。
分野Bで学ぶべきことは多いため、noteでは公式テキストの分野Bを前後編に分割して掲載しています。
本有料noteでは、分野Bの後編として、アルゴリズムの解説を掲載しています。合格水準の点を取る為に、また該当分野の学習者への情報提供の為に、また「AI(機械学習)に用いる技術的な知見」について学習する参考に、活用して頂ければ幸いです。
なお、人工知能プロジェクトマネージャー試験は分野A~Gまでの全7分野で構成されています。各分野に加え、はじめに・参考資料リストなど全体を書籍としてお読みになる場合は、ぜひ公式の電子書籍版のご購入もご検討ください。
noteから分野別に購入するより、金額的にもお得になっています。
また、全分野共通の前提理解について確認したい方は、ぜひ無料で公開している下記のnoteもご覧ください。また、分野Bの前編も有料noteでご覧になることもできます。
【ご注意事項 ※ 必ずご購入の前に確認ください】
本有料noteは、人工知能プロジェクトマネージャー試験 公式テキスト「AIを活用する技術を学ぶ」より、第2章部分の後半を抜粋したものです。
公式テキストをご購入済みの方は、同内容ですのでご注意ください。
本書の著作権等の権利は一般社団法人 新技術応用推進基盤および著者にあります。無断で複製、転載、販売、公開等することは、有償・無償に関わらず一切認めておりません。権利が侵害された場合、法律に基づいて処罰される可能性がございます。
第2章:分野B「統計的理解」
「モデルの作成」の工程
アルゴリズムの理解をする
データを理解し、アルゴリズムに投入できるようデータを準備したら、いよいよモデルの作成に入ります。
数理モデルの作成、すなわち「データをいくつかのアルゴリズムにあてはめ、未知のデータの予測や分類を可能にすること」は、AIの核心部分です。AI開発とはすなわちこのモデルを開発することであり、モデルが上手く機能するよう周辺を開発することであるとも言えます。
そのためマネージャーとしては、まずモデルの元となる代表的なアルゴリズムにはどんな種類があるのか知っておく必要がありますし、アルゴリズムがどういう状態になれば良い状態と言っていいのか理解しておく必要があります。マネージャーの頭の中で最終的にどんなモデルに帰着するのかがイメージできていると、試行錯誤を効率的に進めていけるようになります。
なお、現代のAI開発はツールの利便性が向上しており、昔のようにマネージャーがアルゴリズム選択をするといよりは、とりあえず一般的に用いられるアルゴリズムはすべて試し、精度が良いものを採用するということができるようになっています。
しかしだからといって、アルゴリズムの理解が不要になったわけではありません。アルゴリズムの特徴を理解しておかねば、結果的になぜ精度が良かったのか解釈することもできませんし、そういった解釈からパラメータを調整したり、複数のアルゴリズムを組み合わせたりしてさらに良いものを発見することも難しくなってしまいます。パラメータフィッティングにも、作り上げたAIの仕組みを関係者に説明するにも、代表的なアルゴリズムの概念は理解しておく必要があります。
余談ですが、様々な書籍・インターネット上の文章には、アルゴリズムを予測と分類にわけて説明しているものを見かけます。この仕分けそのものが問題だとは申しませんが、筆者の経験上で言うと、初めて学習をする方への説明としてはこの分類は誤解を招くことも多いように思います。
例えばシンプルな回帰分析を想像してみてください。X軸とY軸のグラフ上に過去データをプロットして回帰直線を引けば、その延長線上にある未知のデータを予測することができます。その意味で回帰分析は「予測モデル」ということができるでしょう。しかしまったく同じ回帰分析でも、例えば「回帰直線の上か下かで分類する」ように使えば、「分類モデル」としても機能させることができます。統計処理としてやっていることは同じですが、目的によって「予測モデル」にも「分類モデル」にもなりえるというわけです。
これから学習を始める方の場合、つい「予測」用のアルゴリズムと「目的」用のアルゴリズムが別々にあるのかな、という思想でスタートしてしまうことが多く、わかりづらさの一因となっているように思います。
筆者としては、まずシンプルに統計処理の仕組みとしてどうなっているのかを理解しておき、これを自分が行いたい目的にどう応用するか(予測することに活用するか、分類することに活用するか)考えるという順番で理解をしてみることをすすめます。
なおアルゴリズムの分け方は様々あり、他にも「ブラックボックスモデル(モデルの中身はよくわからないが、とにかく入力データをいれると値を返してくれる)と記述式モデル(入力データに対してこういう理由でこの値を返したと判別可能なもの)」などもよくみかけます。実務上の取り組みとしては、こうした分け方の流儀にこだわってもあまり意味はなく、よく使われるアルゴリズムの仕組みをしっかり理解することを優先しましょう。
重要なのは、様々なアルゴリズムの概念を理解しておくことで、「いまAIで解きたい問題は、どんなモデルなら実現できそうだろうか」と想像できるようになることです。この想像はAIの基本的な骨格にもなりますし、目標設定における乗り越えるべきハードルがどのようなものか想像できるようになることにもつながります。
それでは以降、タイプ別に代表的なアルゴリズムを解説していきます。
スコアリング系のアルゴリズム
スコアリングは最もシンプルなアルゴリズムの1つです。n個のデータを価値の高い順/低い順に並べるというもので、あえて「アルゴリズム」と表現せずとも、一般生活の中でも自然に用いている考え方かと思います。最も有名な使い道はWEBのページのランキングでしょう。被リンクや記載内容、分量、更新頻度などの要素を基に、最終的にそのページに点数をだし、ランキングしていきます。
ここから先は
¥ 880