【JASPと統計 その2】JASPで使うデータファイル
JASPは、CSV形式のファイルを使うことができます。日本語の変数名やデータがあるときは、UTF-8形式で保存するとよいようです。いうて、ダブルバイトのデータはトラブルの元になるのは世の常なので、心配な人は日本語を使わないデータにしておいた方がよいでしょう。
上のサンプルデータですが、1行目が変数名です。日本語で指定します。データは予防接種の有無(0:なし1:あり)、38度以上の発熱(0:なし1:あり)という感じです。あり・なしで入れてもよかったのですが、ここは数値で入れました。
このデータはExcelで入れています。このままだとExcel形式で保存になってしまうので、保存をするときに「CSVのUTF-8形式」に変更してやります。
CSVというのは、Comma Separated Value(コンマ区切り)のことです。UTF-8というのは、文字コードの体系の一種です。いくつか種類があるのですが、JASPで日本語が入っているときはUTF-8にしておくのが良さそうです。
以前に比べて、解析用のデータに日本語が入っていることの問題はだいぶ減りました。何が問題かというと、多いのが日本語が表示がされない(いわゆる文字化け)や、アプリが動かなくなったり強制終了(いわゆる落ちる)してしまうことです。昭和の時代からコンピュータを使っている人間からすると、「まあそうだよね」という感じでしかないのですが、今の大学生とかはビックリしてしまうかもしれません。
日本語(2バイト文字)は、コンピュータで使用するにはどうしてもいろいろなハンデがあります。それでも、JASPなどは文字コードをUTF-8に指定すればそれほど問題になることはないような感じです。あまりに頻回に落ちる、または絶対に不具合を回避したいという場合は、日本語のないデータにしておいた方が問題が回避できる可能性は高くなるでしょう。
なお、JASPは質的(名義・順序)データには、値にラベルを付けることができます。
変数名をダブルクリックすると、上の図のようにラベル設定ができるようになります。ここでラベルを設定すると、データとしては数値で、JASP上ではラベル設定した文字で表示されます。SPSSの値ラベルと同様と考えて良さそうです。
なお、このラベルは元のCSVデータには反映されず、結果と共に保存するJASP形式のデータが持っているようです。
この記事おしまい