見出し画像

歯科統計学 1

統計の基本概念だが、母集団からサンプルを抽出し統計学的特徴を求め、これにより母集団を推察することを言う。

統計の分類

記述統計・・・今あるデータの特徴を簡単にわかりやすく数量的に表現する

推測統計・・・今あるデータの特徴から母集団の特徴を推測する

それぞれについて述べていく 
記述統計 
基本統計量を用いる 
データの分布 ― ヒストグラム
分布の中心値―平均値 ・ 中央値 ・ 最頻値
分布の範囲 ― 最大値 ・ 最小値 ・ 四分位点
分布の拡がり ―偏差 ・ 分散 ・ 標準偏差

例えば算数の100点満点のテストを15人のクラスで行ったとする

81 78 78 67 98 100 67 34 22 19 67 65 69 87 64
点数は以上の通りとなった。
これをヒストグラムに表すと

スクリーンショット 2021-05-30 17.35.14

このようになる。これによって視覚的に正規分布かどうか見ることができ、後の検定法を選ぶときに非常に役に立つ。
ここから、平均値、中央値、最頻値を指し示すことができる。
また、四分位範囲を求めて、箱ひげ図を描くこともできる。
偏差や分散、標準偏差なども用いる。

変数

ここで統計における検定法を定める上で有用な変数について書く。
変数は主に4つに分類される。

名義尺度
他と区別し分類するための名称のようなもの
例:男女、血液型、郵便番号、住所、本籍地、所属学部、学籍番号
順序尺度
順序や大小には意味があるが間隔には意味がないもの
例えば、1位+2位≠3位のように、足し算引き算ができないもの
例:1位 / 2位 / 3位…、1. 好き / 2. ふつう / 3. 嫌い、統計検定®1級 / 2級 / 3級 / 4級、がんのステージ分類におけるステージI / II / III / IV
間隔尺度
目盛が等間隔になっているもので、その間隔に意味があるもの
例えば、気温が19℃から1℃上昇すると20℃になるとは言えるが、10℃から20℃に上昇したとき、2倍になったとは言えないもの
例:気温(摂氏)、西暦、テストの点数
比例尺度
0が原点であり、間隔と比率に意味があるもの
例えば、身長が150cmから30cm伸びると180cmになると言えるし、1.2倍になったとも言えるもの
例:身長、速度、睡眠時間、値段、給料、幅跳びの記録

「間隔尺度」と「比例尺度」は非常に見分けづらい場合があるが、この2つの尺度を見分けるコツは、「0」の値に意味があるかどうか」を考えること。温度や西暦は「0」だったとしても、その温度や西暦が「無い」わけではない。一方で、身長や速度が「0」であるときは、本当に「無い」ときです。

また、「体重」が「0kg」の場合、体重が「無い」ことになるので「比例尺度」になる。「テストの点数」や「偏差値」が「0」の場合、点数や偏差値が「無い」ということを示すわけではない(0だとしてもそれはあくまで点数や偏差値が0という値であったということを示す)ので「間隔尺度」になります。

いいなと思ったら応援しよう!