統計ソフトStataを知る(1):基本の仕組み
世の中には統計ソフトがたくさんあります。
Stataはそのうちの1つ。
Stataは他のソフトに比べやや難しい。だってマニュアルも英語だし。
何よりも有料なのです(高いんだなこれが)。
したがって、一般向けというよりアカデミックな利用が多いソフトです。
だからいざ使うとしても、困ったことに日本語のヒントが見当たらない…
ということで、できるだけ単純かつ簡単に、Stataについて知っていこう!
という試みです。
1.Stataをどう使うのか
どう使うのかって、そりゃデータを統計検定するんでしょ!
と言わず、少し考えてみましょう。
Stataに限らず統計ソフトを使うとき、
あなたの手元には当然何らかのデータが存在します。
それは、紙でもらったアンケートの束かもしれません。
その結果を入力したExcelかもしれません。
あなたはそのデータを愛おしく眺め、集計したり、グループ分けしたり、
あるいはデータ同士の関係性を知りたいと思っています。
あなたはStataにそのデータを読み込ませ、
知りたい情報を得るためにStataに分析の命令を出して、
その結果を得ることができます。
はい、そうです。「Stataをどう使うのか」はたった3行になりました。
つまり、
①データを取り込む
②そのデータを分析(統計検定)する
③結果を(表やグラフで)手に入れる
これがStataの使い方です。シンプル、でも以外と大事なことなのです。
Stataの解説書の多くは、こんな初歩的なことは書く必要がないためなのか、
いきなりウインドウの説明から入るものが多く感じます。
この3ステップを知っていると、なぜこの作業が今必要なのか、
すんなりと入って作業ができるんじゃないかと思います。
2.Stataの構造
では、3ステップを頭に置いて、Stataの構造について知っていきましょう!
Stataは大きく以下の2つの作業場所を備えています。
「データ格納庫」
「操作と結果出力の場」
☆データ格納庫☆
分析したいデータを入れておく場所です。
3ステップの「①データを取り込む」で、
取り込んだデータを保管する場所ということです。
StataではData Browserという名前で、Excelみたいなシートが開きます。
(編集するときはData Editor)
まずデータを取り込まないと分析ができないので、
「データ格納庫」にデータを取り込む作業が必要です。
紙のデータしかなければ直接入力できるし、
Excelデータを取り込む(インポート)こともできます。
☆操作と結果出力の場☆
取り込んだデータに対して、
分析の命令を出したり、結果が表示されたりする場です。
3ステップの②と③が同時にできる場ということです。
Stataを開くと最初に表示されるウインドウがこの「場」です。
分析ウインドウが最初に開くのは、統計ソフトという感じがしますよね。
この「操作と結果出力の場」は主に4つのウインドウで構成されています。
Command:②「データを分析する」で使う場所です。
命令を書いてStataに解析作業をさせます。
Review:Commandで書いた命令の履歴が表示されます。
Results:③「結果を手に入れる」の部分です。
書いた命令に対する結果が表示されます。
Variables:読み込んだデータの情報が書いてある場です。
詳細は「変数」の記事で書きたいと思います。
こうやって見ると、そんなに複雑な構造ではないですよね!
最後にDoファイルについて紹介します。
Doファイルとはあらかじめ 命令を書いておくメモのようなものです。
同じデータを分析したいのに、毎回Commandを書くのは面倒!
そんなとき、あらかじめ命令を書いておいたDoファイルがあると、
Doファイルを読み込むだけでStataが解析をやってくれます。
3.まとめ
Stataの使い方と構造を見てきました。
図にするとこんな感じ。
次回はデータ格納庫にデータを入れることについて考えたいと思います。