見出し画像

独立サンプルt検定を実施するプログラムを作ってみた(OS:Windows)

★自己紹介

ども、会社員+副業で働きまくるオーバードライバー、通称オドバーでござる。

「オーバードライブ」は限界を超えて動き続ける状態を表すことばで、体力おばけってこと。

普段はタイミーでの業務について記事を書いている筆者だが
t検定を実施するプログラムのプロトタイプを作成したので、今回は毛色を変えて、その内容を記事にしようと思う。

t検定について

★そもそもt検定とは?

t検定とは、2つのグループの平均値の差が統計的に有意かどうかを検証するための統計手法である。

この検定は、小規模なサンプルサイズにおいて特に有効であり、主に以下の3種類に分類される。

  1. 独立サンプルt検定
    2つの独立したグループの平均値を比較するための検定である。
    例えば、異なる2つのグループのテスト結果を比較する場合に用いられる。

  2. 対応のあるサンプルt検定
    同じグループの2つの条件における平均値を比較するための検定である。例えば、あるグループの実験前後のデータを比較する場合に適用される。

  3. 1サンプルt検定
    1つのグループの平均値が既知の特定の値と異なるかどうかを検証するための検定である。例えば、ある製品の平均的な重量が規定値と異なるかどうかを検証する際に使用される。

★t検定の手順

t検定の基本的な手順は以下の通りである。
t値が何か、p値が何かということの詳細な説明は省くが
p値の値によって、後述の帰無仮説(平均値の差がないと仮定する)を棄却するかどうかを判定するのだ。

ちなみにだが、帰無仮説を棄却するという結果となった場合
それは統計的に平均値に差がある可能性が高いということを意味していると解釈しても問題はないだろう。

  1. 仮説の設定(一般論)

    • 帰無仮説 (H₀):平均値の差がないと仮定する。

    • 対立仮説 (H₁):平均値の差があると仮定する。

  2. t値の計算
    サンプルデータからt値を計算する。

  3. p値の比較
    計算したt値に基づいてp値を求め、設定した有意水準(通常0.05)と比較する。

  4. 結論の導出
    p値が有意水準より小さい場合、帰無仮説を棄却し、平均値の差が統計的に有意であると判断する。

t検定は、科学的研究やデータ分析の分野で広く用いられ、効果や違いの有無を評価するために重要な役割を果たしている。

t検定実施プログラムの開発

まず、今回の開発の前提は以下だ。

  • 独立サンプルt検定のみ開発実施

  • pythonでバックエンドのみ開発実施

  • pythonのフレームワークはdjango(読み方:ジャンゴ)を使用

  • 動作環境はpythonの仮想環境。


認証を含むフロントエンドの開発(WEBサイトなどからt検定が実施できるように)も今後していこうと考えて、とりあえずフレームワークはdjangoを使用した。

手順については1から説明していこうと思う。
まずは、pythonの環境構築(Windows版)だ。

pythonの環境構築

★pythonのインストール(下記の参考画像も参照願う)


  • Python公式サイトにアクセスし、Windows用のインストーラをダウンロードする。

  • インストーラを実行し、「Add Python to PATH」にチェックを入れてインストールを進める。
    ※デフォルトではチェックがついていないため注意
    (環境変数にpythonのパスを追加しない場合はチェック不要)

  • コマンドプロンプト(win+rを押下して"cmd"と入力)で python --version を実行し、インストールが成功しているか確認する。
    「Python X.X.X」とpythonのバージョンが表示されれば成功している。


参考画像

参考:ダウンロードのリンクをクリック


参考:スクロールしてインストールしたいバージョンをクリックしてインストーラーのダウンロード(筆者の場合はWindows 64bit)
参考:PCにダウンロードされたインストーラーをダブルクリックで実行
参考:Add python.exe to PATHのチェック


参考:win+rを押下すると以下が表示されるため、cmdと入力してコマンドプロンプトを開く。


参考:pythonのインストール成功確認


★pythonの仮想環境の構築

仮想環境を使用して、プロジェクトごとに依存ライブラリを管理する。

以下のコマンドを入力して、仮想環境の構築をする(今回は仮想環境の名前は"env"としているが、ここは任意の名前で問題ない。逆にenvというディレクトリが既に存在している場合、上書きされるため注意が必要)。

python -m venv env

コマンドを実行してもコマンドプロンプト上には何も出力されないが、それでok。

コマンド実行結果

コマンド実行後には、コマンドを実行したディレクトリ(筆者の場合はC:\Users\user)の配下に"env"というディレクトリが作成され、そのenvの配下にpythonの仮想環境用のディレクトリとファイル群が作成されているはずである。

C:\Users\userの配下にenvが作成されている
envの配下に仮想環境のディレクトリやファイル群が作成されている


仮想環境の構築ができたら、続けて必要なライブラリのインストールを実施するため、以下のコマンドで有効化させておこう。
コマンド実行後に(env)の表記が出ていれば仮想環境が有効化されている状態だ。

.\\env\\Scripts\\activate
.\\env\\Scripts\\activateのコマンド実行前
.\\env\\Scripts\\activateのコマンド実行後
.\\env\\Scripts\\activateが指す場所


★必要なライブラリのインストール

フレームワークをdjangoとしてpythonで独立t検定を実施させるためには以下のライブラリが必要であるため、仮想環境にそれらをインストールさせる必要がある。()内はバージョンを記載する。

  • django(3.2.25)

  • pandas(1.3.5)

  • scipy(1.7.3)

以下のコマンドでインストールをしよう。

pip install django pandas scipy
ライブラリのコマンド実行前
ライブラリのコマンド実行後(warningがでるが問題なし)


以下のコマンドでインストールされたライブラリを確認しよう。
この場合はdjango,pandas,scipy以外のライブラリも表示されているが、必要なライブラリを自動的にインストールしているだけのため問題ない。

pip freeze
インストールされているライブラリの確認


★Djangoプロジェクトのセットアップ

必要なライブラリのインストールができたら、以下のコマンドでdjangoプロジェクトのセットアップをしよう。ここでいうttest_projectはプロジェクト名のため自由に変えてもらって問題ない。

django-admin startproject ttest_project

ここから先は

5,986字 / 34画像 / 1ファイル

¥ 500

PayPay
PayPayで支払うと抽選でお得

この記事が参加している募集

この記事が気に入ったらチップで応援してみませんか?