マガジンのカバー画像

Stata一人勉強会

8
運営しているクリエイター

記事一覧

ロジスティック回帰分析でのVIF計算(Stataでの解決方法)

ロジスティック回帰分析でのVIF計算(Stataでの解決方法)

多重共線性についてVIFで評価したい。多重共線性を評価したいときに、いくつか方法が提案されていますが、VIF(分散拡大要因, Variance Inflation Factor)を計算したいという場合は、それなりにある自体だと思います。

線形回帰分析に対しては、多くのソフトでVIFを計算することが可能(なんなら、頼まなくても計算してくれる)ですが、ロジスティック回帰分析では、なかなかそうはいかな

もっとみる
Stata Tips: 全角英数字を半角に変換するための完全ガイド

Stata Tips: 全角英数字を半角に変換するための完全ガイド

データ分析における最初のステップはデータのクリーニングで、それはしばしば最も時間がかかり、しかし最も重要なステップとなります。

その中でも文字列変数の操作は、面倒なのであまり丁寧に行われないか、諦められるかの何れかです。

特に、外部(あまりデータ分析を行っていない)から提供を受けるデータでは、文字列変数に何故か全角英数字を半角英数字が混ざっています。おそらく全ての解析ソフトで全角と半角は異なる

もっとみる
オッズ比と信頼区間からp値を出す。

オッズ比と信頼区間からp値を出す。

論文投稿準備していたら、投稿規定に「p値を書け絶対だ」(意訳)というp値縛りがありました。

書けと言われたのだから、p値を計算して書けば良いのですが、投稿準備中の論文は「データ提供元の規約によって生データを削除済み」ということで、今からp値を計算できないという状況です。

ただし、既に作っている表には、オッズ比とその95%信頼区間のみがかかれています。

そこで、オッズ比と95%信頼区間からp値

もっとみる
【Stata】 変数名から変数ラベルを呼び出したい

【Stata】 変数名から変数ラベルを呼び出したい

Stataでわすれがちな変数名から変数ラベルを呼び出す方法をStataのヘルプファイル調べても、なかなか見つかりません。

そこで、自分の備忘録的なnoteを残しておきます。同じことでお困りの方はご参考にしてください。

変数ラベルの貼り付け方と呼び出し方

一般に変数は半角英数のみで名前を付けておく方が便利です。
しかし、中身が何だったか忘れないように、変数ラベルを貼っておく必要もあります。

もっとみる
【Stata】SIFをHRFに変換するにはどうする?

【Stata】SIFをHRFに変換するにはどうする?

How to translate SIF to HRF ?

Stataでは、時間や日時を扱うデータをSIFというフォーマットで扱っています。これとは逆に、文字列の状態(2020/8/15等)の状態のことをHRFと呼んでいます。

SIF=Stata Internal Form
HRF=Human Readable Form

Stataマニュアルには、HRFをSIFに変換する方法は関数が用意され

もっとみる
Stataで処理に要した時間を記録したい。

Stataで処理に要した時間を記録したい。

自分用のStata備忘録です。

問題意識とても時間がかかる処理を行う時に、要した時間を記録したいことがあります。

logの最初から最後までの必要時間なら、取ったlogを後から確認すれば良いのですが、途中の一部に要する時間を知りたいという場合にはlogでは時間が記録されません。

どうするのか?display " Start at: $S_TIME $S_DATE"do foobar // 時間

もっとみる
- rreg - Stataでロバスト回帰する

- rreg - Stataでロバスト回帰する

回帰分析したいけれど、外れ値をどうにかしてやりたい。良くある事だと思います(当社比)。

Stataではいくつかの方法がありますが、そのうちの1つであるrregについて、使用方法を学んだので、備忘録的にまとめておきたいと思います。

rregコマンドについては、下記の様に説明されています。なるほど、わからん。

rreg first performs an initial screening ba

もっとみる
OLS回帰係数の和の標準誤差をどうやって求めるのか?【Stata】

OLS回帰係数の和の標準誤差をどうやって求めるのか?【Stata】

なんやかんやあって、解析で、回帰係数の和とその標準誤差で作表が必要ということになりました。

回帰係数の和は足せば良いので、すぐに分かるのですが、和の標準誤差はどうするんだろう。わからん。

調べた結果を、今後おなじことで困った人(未来の自分含む)のために、日本語で記録しておこうと思います。

検索ワードは「standard error of the sum of two coefficient」

もっとみる