![見出し画像](https://assets.st-note.com/production/uploads/images/72789125/rectangle_large_type_2_23e9db841d79af8b0c1184e7b1bcef64.png?width=1200)
【STATA Techs-003】データの加工処理
THEME:データ処理の際に有用なコマンドを紹介
GOAL:異常値や欠陥値などを加工処理し、データ分析に入ることができる
◯サンプルデータ◯
◯使用コマンド◯
replace varname = varname + x
:変数に四則演算
generate newvar =~
:新変数の作成
※「gen」だけでも可
rename varname newvar
:カテゴリ名変更
ex)rename ecosat esat
drop varname
:変数の削除
recode varname x=y
:指定の値を任意の値に置換
ex)recode inc 1=100 2=300 3=500 4=700 5=900 6=1100 7=1350 8=1750 9=3300
recode varname x=.
:欠損値処理
ex)「999」が欠損値の場合、recode varname 999=.
drop if varname ==.
:欠損を含む列を消す
drop if varname > x
:異常値の削除
例)total_incomeにおける1275より大きいデータを消す場合、
drop if total_income>1275
*等号・不等号の関係は以下
・if varname == x :xとvarnameが等しい時
・if varname ~= x :xとvarnameが等しくない時
・if varname > x :varnameがxより大きい時
・if varname < x :varnameがxより小さい時
・if varname >= x :varnameがx以上の時
・if varname <= x :varnameがx以下の時
◯数学的関数◯
・log(varname):varnameの自然対数をとる
= In(varname)
・log10(varname):varnameの常用対数をとる
・sqrt(varname):varnameの平方根をとる
・abs(varname):varnameの絶対値をとる
・exp(varname):varnameのe^xをとる
例) gen log_income = log(income)
======
本田恒平(Kohei Honda)
一橋大学大学院経済学研究科博士後期課程(政治経済学、労働政策)
▼質問やご意見等はコメントかホームページのフォームから▼
▼SNS▼
Twitter: https://mobile.twitter.com/4strings725
Facebook: https://www.facebook.com/profile.php?id=100002374515435