◾️はじめに
ITパスポート という国家試験の勉強を始めました。
「試験勉強ノート」を作るつもりで、自分が新たに知ったことを書き留めていきます。
この試験、内容は大きく分けて次の3つです。
①ストラテジ(経営戦略)系
②マネジメント(管理)系
③テクノロジ(IT技術)系
シラバスの順に従って、今回は、
①「ストラテジ(経営戦略)系」
>「2. 業務分析・データ利活用 」
>(3) データ利活用
>-2 データ分析における統計情報の活用
の勉強ノートです。
データをどう選ぶか、出た結果をどう解釈するかによって得る結論が変わってきてしまいます。この「調査データの危うさ」をよく認識することで良い調査結果と良い結論を得るための知識が今回の内容です。
今回は、ワードの必要十分な説明が提供されていると判断したものは部分引用ではなく、リンクを紹介しています。
項目中の★印は、現時点での最新版(2024年10月試験)で導入されたことを表します。(今回の項には新導入の内容はありません。)
シラバス掲載ページはこちら↓
https://www3.jitec.ipa.go.jp/JitesCbt/html/about/range.html
◾️今回の解説項目
今回の項目のシラバスの内容は次の通りです。
説明不要と判断したいくつかを除き用語例・活用例としてあげられた概念に解説をつけていきます。
(3) データ利活用
・データを分析して利活用することによる,業務改善や問題解決
② データ分析における統計情報の活用
・データから言えること,データが何を意味するかを適切に把握することの重要性 ・扱うデータに関する領域(業界,専門分野など)に特化した知識(ドメイン知識)の重要性
・データの発生現場を確認することの重要性
・文献や現象を読み解き,それらの関係を分析・考察して表現すること
[用語例]
母集団
標本抽出(国勢調査,アンケート調査,全数調査,単純無作為抽出,層別抽出,多段抽出)
仮説検定
有意水準
第 1 種の誤り,第 2 種の誤り
精度と 偏り
統計的バイアス(選択バイアス,情報バイアスなど)
認知バイアス
[活用例]
各代表値の性質の違い,統計情報の誇張表現に惑わされない理解
🟠母集団・全数調査
🟠標本抽出
🟠標本抽出の諸方法(単純無作為抽出,多段抽出,層別抽出)
🟠仮説検定・有意水準・第 1 種の誤り,第 2 種の誤り
ITパスポート試験では、実際の統計的検定を行うのではなく、概念を理解しておくことまでを求められるようです。
これについて秀逸と私が判断したのは次のまとめです。
計算式から理解するのに挑戦したいという方には次のページが良さそうです。
🟠精度と偏り
イメージとしては次の図がわかりやすいです。精度=「ばらつき」の少なさ、また、偏り=データが「平均的にどれだけ、どのように真の値からずれているか」と考えると良いようです。
偏りの種類についての解説は次のものがわかりやすいです。
🟠統計的バイアス(選択バイアス,情報バイアスなど)
次のページに簡潔、かつ具体的な説明がありました。
🟠認知バイアス
マーケティングに焦点を当てた例を挙げて説明をしてくれている次のサイトがわかりやすいです。
⬜︎ 終わりに
いかがだったでしょうか。
私は高校の教員時代、「総合的な探究の時間」の指導をしていました。社会課題の現状をデータで示すために意識調査をアンケートで行う際には、気をつけようねと生徒に言っていた標本抽出の留意点が出ていました。しかし、それ以外にも本当は知っておくべきことがあったなぁと勉強になりました。
全部を授業でカバーするのは難しいですが。
次回は、
①「ストラテジ(経営戦略)系」
>「2. 業務分析・データ利活用 」
>(3) データ利活用
>-3 データサイエンス,ビッグデータ分析
についての予定です。