4. 統計の基礎的知識【第18回考査選択問題集】
全20問 / 2024-10-22公開(約9,700字)
本noteでの表記等
用語や解釈は、実務修習のテキストに合わせている。
実務修習のテキストに記載がある部分のみ出題している。ただし、説明を正確にするため等の理由で、テキスト記載外の用語も含む場合がある。
必要がある場合は、テキストに記載のない論点や説明を入れている。
1. 概要
問1(記述統計・推測統計)
解:○(講義テキストp230付近)
記述統計(記述統計学)とは、データから調査対象の集団についての傾向を知ること、また、データ全体のあらましを記述するための方法である。これがデータ分析の基礎である。
一方、推測統計(推測統計学)とは、対象とする集団の一部だけを測定したとき、その結果(統計量)から集団全体の特性を推測する方法である。
大きな壺の中にボールがN個入っており、それぞれに実数が書かれているとする。壺の中のボールの全体を母集団といい、抜き出されたボールを標本という。n個のボールを抜き出すときのnを標本の大きさといい、壺の中のボールの総数Nを母集団の大きさという。
母集団に対して調査を行う全数調査は費用も時間もかかるので、国勢調査など限られた調査しか行われない。対して、標本調査は、母集団の一部を抽出して母集団の特性値を調べる方法である。標本調査によって母集団の特性を推測することは、推測統計という考え方に基づく。
※補足
なお、講義テキストでは、回帰分析を推測統計に分類している。しかし、一般的に、回帰分析そのものは記述統計に分類されるものである。
とはいえ、通常は全数調査を行うことが困難であるため、母集団の特性について知るには推測統計の方法を組み合わせることが必要となる。推測統計には、「推定」と「統計的検定(仮説検定)」という理論があり、テキストに記載されている F検定(p252付近)や t検定(p257付近)は後者に含まれる。
問2(比例尺度)
解:×(講義テキストp231付近)
比例尺度は、量的データである。
量的データ(量的変数)とは、連続的な値であり、一般に数値で表現される。
一方、質的データ(質的変数)とは、離散的な値(飛び飛びの値)であり、値が分類を表すものである。例えば、性別、血液型、地目、用途地域等がこれにあたる。
比例尺度(比率尺度)とは、数値の比の大きさが意味を持つ量的データである。値が順序や差の大きさを示し、原点(ゼロの値)が絶対的な意味を持つものである。例えば、長さ、重さ、所得、価格及び地積等は、0(ゼロ)が何もないことを表す量的データであるため、比例尺度に分類される。原点が0であるため、順序や差だけでなく比(倍率)で表現できる。
量的データの測定尺度として、他に、間隔尺度がある。比例尺度と同じく、値が順序や差の大きさを示すが、0は任意の点であり、「何もない」ことを示すものではない。この例として、気温が挙げられる。比例尺度と異なり、倍率で表すことができないものである。
2. 度数分布と基本統計量
問1(標準偏差)
解:○(講義テキストp238下部付近)
標準偏差とは、データの散らばり※1を表す統計量※2をいう。
ファイナンス分野においては、収益率の標準偏差を「リスク」又は「ボラティリティ」といい、損失と利益の不確実性(ぶれ)の大きさを表す。
リスクが大きい、つまり、収益と損失のギャップが大きい場合、大きく儲かる可能性がある反面、大きく損する可能性もあるため、一般的に「危険」と解釈してよい。
※1
分布の「散らばり」(尺度、ばらつき)とは、観測値が分布の中心からどれくらい離れる傾向にあるかをいう。
※2
統計量(statistic)とは、データの特徴を表すために計算される関数である。例えば、標本の平均、分散、標準偏差、中央値、最大値等、数多くのものがある。
問2(ロバスト)
解:×(講義テキストp236付近)
ロバスト(ロバスト性、ロバストネス、robustness、頑健、頑健性)とは、外れ値に振り回されない性質をいう。外れ値とは、何らかの理由により他の値からとびぬけて離れた異常値をいう。
平均値(mean)は、外れ値に引きずられるという欠点がある。
中央値(メディアン, median)は、外れ値に対しロバストである。少数の外れ値があっても値は変わらない。
最頻値(mode)は、中央値よりさらにロバストであるが、最も頻出する値が複数ある場合、それら全てが最頻値となってしまう問題がある。
なお、正規分布や一様分布のように、データが完全に左右対称である場合、平均値と中央値は一致する。
問3(3シグマ範囲)
ここから先は
¥ 500
この記事が気に入ったらチップで応援してみませんか?