統計学を装備する!2 〜データ〜
統計学を利用するとは解決したい問題を明確にして関係するデータを収集して整理・加工して分析して解決方法を導き出すことなり。ではデータってなんぞ?
データの種類
データには量的データと質的データがある。
量的データは比率データと間隔データに分類される。
質的データは順位データとカテゴリデータに分類される。
<量的データ>
・比率データ
質量・長さ・年齢・時間(経過時間)・金額とか・温度(K)。ゼロが「存
在しない」を意味するデータ。
・間隔データ
温度(℃)・年号・日付・時計の時間とか。ゼロが「存在しない」を意味しないデータ。温度が0℃は水が氷る温度だが温度が存在しないわけではない。
<質的データ>
・順位データ
競技の順位・満足度・好感度とか。順番やランクがあるけど、差の大きさ ははっきりしねぇデータ。
・カテゴリデータ
電話番号・性別・血液型とか。識別するため使う。数値的な意味はない。
測定尺度
測定尺度というのはデータをどんなふうに扱うかを決めるものさしみたいなもの。データをどういう形式で表すか、それをどう計算するか決める基準となる。データをどういう形式で表すかってのは上記の比率データ・間隔データ・順位データ・カテゴリデータのこと。
尺度の種類は以下、
・比率尺度 = 比率データ
・間隔尺度 = 間隔データ
・順序尺度 = 順位データ
・名義尺度 = カテゴリデータ
あれ?これならデータの種類の前に測定尺度を書くべきだったか、、まあよかよか。
<気になって追記>
比率データ(比率尺度)について。
ゼロが「存在しない」を意味するデータということはマイナス値がないってこと?CHATGPT殿に聞いてみた。えせ東北弁で。して答えは、、
<CHATGPT--------------------------------------------------------------------->
比例尺度(Ratio Scale)では、絶対的なゼロが存在することが条件だから、通常はマイナス値を持たないことが多いんだべ。特に、ゼロが「無」を示すため、体重や長さ、時間、金額といったものはマイナスになり得ないものとして扱われる。しかし、ある条件下で比例尺度として扱われるデータでも、マイナス値が出ることがある例もあるんだ。それについて少し説明するっぺ。
マイナス値がある場合
通常の物理的な数量ではマイナスが存在しないけど、次のような場合に比例尺度でマイナス値が出ることがある:
損失や収益(会計・経済):
収益や資産価値などは、利益がゼロを基準にして考えられるから、赤字(損失)を示す場合はマイナス値になることがある。
例:企業の財務データで、利益が出ていればプラスだが、赤字(損失)の場合はマイナス値になる。利益は比例尺度で扱われ、ゼロが「利益がない状態」を意味するけど、それよりも損失が大きくなればマイナスになる。
負の収支:
収支や投資のリターンなどの分析で、損失が発生したときにマイナス値が使われる。これは、ゼロを基準にプラスとマイナスで表すため、比例尺度として扱う。
例:投資で1年目に+10%のリターン、2年目に-5%のリターンを記録する場合、この場合も比例尺度の一環として扱われる。
<---------------------------------------------------------------------CHATGPT>
さらに、
「比例尺度のマイナスがないやつ、あるやつの例をみるに、データそのものが独立というか単体で成立しているものがマイナスがなくて、お金のように人工的なものはマイナスがある場合があるってことか?」と聞いてみると、
<CHATGPT--------------------------------------------------------------------->
そうだべ!まとめると、マイナスがない比例尺度のデータは、物理的・自然な数量で、ゼロが「完全に無」を示しているもの。これらは単体で存在するし、マイナスの概念が自然には存在しないんだ。
一方で、マイナスがある比例尺度のデータは、人工的な概念や、人間が作ったシステムであり、ゼロが基準点として設定され、その基準から上下に動く概念なんだべな。
だから、アンタの考え通り、自然界での単体の数量はマイナスがなく、人工的に作られたシステムや概念にはマイナスがある場合がある、ってことなんだ。
<---------------------------------------------------------------------CHATGPT>
とのこと。納得した。
この記事が気に入ったらサポートをしてみませんか?