記事一覧
Stata Tips: 全角英数字を半角に変換するための完全ガイド
データ分析における最初のステップはデータのクリーニングで、それはしばしば最も時間がかかり、しかし最も重要なステップとなります。
その中でも文字列変数の操作は、面倒なのであまり丁寧に行われないか、諦められるかの何れかです。
特に、外部(あまりデータ分析を行っていない)から提供を受けるデータでは、文字列変数に何故か全角英数字を半角英数字が混ざっています。おそらく全ての解析ソフトで全角と半角は異なる
ハゲタカジャーナルは、もう少し設定を詰めてからメールを送った方が良いと思う。
だいたいの研究者は経験したことがある、怪しいジャーナルからのお誘いメールについてです。
設定に無理があるメールがきたので紹介します。
和文誌のレター(学会員のみ読める)に対して、下記のようなメールが届きました。Global Journal of Medical Researchというジャーナルの編集長からのメールです。
このジャーナルの編集長は、和文誌を出版している学会の会員に英国の方が入っ
5-ALAとシアン化物のあれこれ
業務日誌的な備忘録本日、T社の5-ALAサプリメントに、0.2ppmのシアン化物が含まれているという情報を見聞きしたために、不安になったという相談がありました。
まず、食品での基準値は10ppmですので、0.2ppmは無視してよさそうです。また、シアン化カリウムのTDI(耐用1日摂取量)は、体重1kgあたり、1日0.0045mgですので、体重60kgなら0.27mgを毎日摂取しても影響ない、と言
2022年8月発災の一酸化炭素中毒事故・備忘録
一酸化炭素中毒に関する重要な労働災害ですが、書き留めておかないと忘れられてしまいます。また、同業他者への注意喚起しにくくなってしまうので、このnoteにて残しておきたいと思います。
なお、企業名は本質的な情報ではないので、記載していません。(情報元にいけば、見ることはできますが…)
まとめると、防止のために必要だったことは、下記2点になるかと思います。特に新規性がない話ですが、基本に忠実なこと
【Stata】 変数名から変数ラベルを呼び出したい
Stataでわすれがちな変数名から変数ラベルを呼び出す方法をStataのヘルプファイル調べても、なかなか見つかりません。
そこで、自分の備忘録的なnoteを残しておきます。同じことでお困りの方はご参考にしてください。
変数ラベルの貼り付け方と呼び出し方
一般に変数は半角英数のみで名前を付けておく方が便利です。
しかし、中身が何だったか忘れないように、変数ラベルを貼っておく必要もあります。
「交絡」の初出は鎌倉時代どころか5世紀まで遡れる件。
「交絡」という語やConfoundingの訳語としての使われ方は、いつからなのか知りたくなって、調べられるだけ調べました。
もし、追加情報を持った方がいらっしゃったら、教えてくれると嬉しいです。
2021/05/25
@nutrepi先生から指摘された文献の年違いを修正。その他の誤字修正。
@2988yukikaze様から凄い情報を頂きましたので追記。
結論「交絡」の初出は鎌倉時代どころか、
「『ポビドンヨードによるうがい』の新型コロナ軽症患者への活用」研究は、倫理審査手続きがまずいのでは?
大阪府のポビドンヨードによるうがい研究の発表には、Twitterで医療系クラスタを絶句せしめたようです(個人の観測です)。科学的な側面についての指摘は多数入っていますし、私もどうかと思う点もあります。
しかし、研究内容の詳細は明らかにされていないので、もしかしたらちゃんとやっているのかもしれません。解析を担当されているのが、横浜市立大学医学部 医療統計学 山中竹春先生ですから、おそらく報道や大阪
【Stata】SIFをHRFに変換するにはどうする?
How to translate SIF to HRF ?
Stataでは、時間や日時を扱うデータをSIFというフォーマットで扱っています。これとは逆に、文字列の状態(2020/8/15等)の状態のことをHRFと呼んでいます。
SIF=Stata Internal Form
HRF=Human Readable Form
Stataマニュアルには、HRFをSIFに変換する方法は関数が用意され
荒唐無稽な解析結果が得られたとき、どうするか?
解析結果によっては、荒唐無稽なのに統計学的に有意な結果が得られることがあるかも知れません。
一律に荒唐無稽だから捨ててしまうという態度で良いでしょうか。あるいは、統計学的に有意だから荒唐無稽であっても受け入れるべきでしょうか。
それについての一意見として、noteを記載しました。
発端下記のようにTwitterに頂いた、質問について回答しようと草稿を書いていたら、ちょっと文章量が貯まってしま
宇崎ちゃん献血コラボの影響解析に関するご指摘への回答など
元noteは下記です。いろんな派生noteを作っていて既に自分でも追えていない。
ここでは、2020/08/09までに未回答の質問に対して回答します。
この②と③について未回答です。①や1つめの質問については、その1、その2、その3にあります。基本的にパラレル仮定について色々、書きました。
有意に増加したと言えるのか?まず、nowhereman134さんから頂いた質問の最後の部分からです。
Stataで処理に要した時間を記録したい。
自分用のStata備忘録です。
問題意識とても時間がかかる処理を行う時に、要した時間を記録したいことがあります。
logの最初から最後までの必要時間なら、取ったlogを後から確認すれば良いのですが、途中の一部に要する時間を知りたいという場合にはlogでは時間が記録されません。
どうするのか?display " Start at: $S_TIME $S_DATE"do foobar // 時間
- rreg - Stataでロバスト回帰する
回帰分析したいけれど、外れ値をどうにかしてやりたい。良くある事だと思います(当社比)。
Stataではいくつかの方法がありますが、そのうちの1つであるrregについて、使用方法を学んだので、備忘録的にまとめておきたいと思います。
rregコマンドについては、下記の様に説明されています。なるほど、わからん。
rreg first performs an initial screening ba
OLS回帰係数の和の標準誤差をどうやって求めるのか?【Stata】
なんやかんやあって、解析で、回帰係数の和とその標準誤差で作表が必要ということになりました。
回帰係数の和は足せば良いので、すぐに分かるのですが、和の標準誤差はどうするんだろう。わからん。
調べた結果を、今後おなじことで困った人(未来の自分含む)のために、日本語で記録しておこうと思います。
検索ワードは「standard error of the sum of two coefficient」
宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その3
元記事、その1、その2
パラレル仮定が成立してないけど、どうする?
その1でまとめましたように、パラレル仮定は成立していないっぽいです。パラレル仮定2については、その2でまとめたとおりです。
ここでは、パラレル仮定1について検討したいと思います。
パラレル仮定1を何とかならないか、考える。
では、次の問題点です。パラレル仮定1は下記の様に定義しました。
パラレル仮定1:関東と合成対照は、宇
宇崎ちゃんコラボのSCM解析の弱点を突かれたので、何かしてみる。その2
元記事、その1、その3
パラレル仮定が成立してないけど、どうする?その1でまとめましたように、パラレル仮定は成立していないっぽいです。しかし、ここで解析を投げ出すわけにはいきませんが、公表データ以外は使えません(日赤に打診はしましたが、ダメでした。とても常識的な判断だと思います)。
私が平素取り扱うデータは、研究のために収集されたり、用意されたデータというのはほとんどありません。
そのため、