見出し画像

2022年の受験(社会学)_⑥北京大学面接に向けた準備(統計学)

どうも~
セイタです!!
この記事では北京大学の面接試験のために実施した統計学に関する勉強について紹介させていただきます。




マガジン全体では、「中国語」「社会学」「統計学」「指導教官の選定」といった4つのテーマで北京大学の受験に向けた準備を書いていきたいと思います。とはいえ、上記の4つのテーマそれぞれがかなり幅広いので、すべてを網羅的に記事にしようとするとかなり長い記事となってしまいます。そこで大まかに学習の方針や有用な教材やサイトの紹介をメインとしていきたいと思います。

この記事は題名の通り、統計学の勉強に関して実施したことを書いていきます。学部では特に統計を勉強してこなかった人向けの記事となっています。

この受験記の概略は下記記事をご参照ください。


自分が受験しようと思った理由については下記記事をご参照ください


2021年の受験期概略については下記記事をご参照ください。


2022年の受験期概略については下記記事をご参照ください。





統計学を勉強する意味

この記事では、社会学の定量調査で用いる統計学について書いていきたいと思います。ひょっとすると「社会学を学びたいがメインは定性調査なのだが、定量調査の手法である統計学を学ぶ必要はあるのか?」とお考えの人がいるかもしれませんので、先にお答えさせていただきます。



もちろんあります。
理由は以下の二点です。

第一に、社会学の学位取得にあたって、統計学を用いた定量調査の授業が必修になっている可能性が高いからです。例えば、北京大学では「線形回帰とその応用」という授業が必修となっています。また、フィールドワークやエスノグラフィーなどの定性調査がメインだといっても、定量調査が全くできないのは社会学で学位を取得するにふさわしくないと思います。

第二に、定量調査における調査手法は定性調査においても大いに活用できるからです。定量調査をする上で必須の概念である「サンプリングバイアス」「マッチング」「コントロール」は、定性調査に応用することで研究の質を上げることができます。込み入った話になるので、これ以上は話しませんが、興味のある方は以下の『社会科学のデザイン-定性的研究における科学的推論』を参照してください。

amazonリンク

アメリカの政治学の大御所3名が書いた社会科学の研究における古典です。ある程度定量調査や統計の知識があれば、さっと読めると思います。自分は中国語で読んだのですが、1週間くらいでパパっと読めました。



ということで、社会学を学ぶ学生が統計学を勉強する必要性について理解していただけたかなと思います。それでは統計学の概念統計解析の実務に分けて書いていきたいとおもいます。




統計学の基礎

統計学という学問はその始まりからして実用的な学問です。ですので、がんがん統計解析をしていって、その都度やり方を覚えるというやり方でいいというのは間違ってはいません。


自分も経済学部の教授より「統計の数学的な部分を本当に理解しようとするとかなり難解だけど、ただ使用するだけならば、そこまで難しくないよ。サンプル数を増やせば、仮説の精度が上がるのは数式であらわそうとするとめちゃくちゃ難しいんだけど、なんとなくわかるでしょ?なんとなくわかれば使えるよ。」といわれました。

とはいえ、全く知識ゼロで統計解析してしまうと、出た結果に対しての解釈ができなかったりします。ですので、ある程度は基礎の勉強をしておいた方がいいです。ここでの「ある程度」というのが非常に難しいのですが、個人的には、「t検定」「重回帰分析」「分散分析」などがだいたい頭に入っているくらいかなと思います。

難易度でいえば、統計検定2級に受かるくらいの基礎があれば、何とか授業にはついていけると思います。実際に、自分は統計検定2級を入学半年前に取得して、北京大学で「線形回帰とその応用」という授業を受けていますが、セメスターの半分は割とt検定、分散分析、重回帰分析などの既知の部分が多かったです。一方で後半はロジスティック分析、パス分析、ネスティッドモデルなどの初めて習う部分がでてきて、ちょっときつかったです。統計検定2級合格までとその後の学習に関しては下記のnoteを参照していただければなと思います。




統計解析の実務

ここに関してはこういうのもなんですが、特にやらなくてもいいと思います笑


というのも、そもそもどのツールを選択すべきかという問いに対して答えが出せないからです。一般的に有名な統計解析ツールは「Python」「R」「Stata」「SPSS」とかがありますが、大学の授業や研究室がどのツールを推奨してくるかが現時点だとわからないからです。

基本的に、周囲の人と同じ統計解析ツールを使っているといろいろ教えてもらえたり、データの処理過程をコード送るだけで済んだりするので、メリットが大きいです。

自分は授業において、「SPSS」及び「Stata」が推奨されているのですが、最終的に授業はすべてSPSSで行われるようになりました。Stataはプログラムコードやデータソースだけ提供されます。なので、仮にRやPythonを選んだら授業の課題さえ提出できない。Stataを選んでも独学で学ぶ必要があります。。

ちなみに、SPSSはかなり簡単なツールという定評があります。ボタンカチャカチャでコードを書く必要がありません。エクセルの上位互換のようなものです。その代わり値段がめちゃくちゃ高いです。確か年間で20万円くらいしたはずです。

自分は初めての宿題の時まで一切SPSSを触らず、すごく簡単な宿題だったので、ぱっと解いてやろうと思ったら全然操作方法がわからず途方にくれました笑

急遽本屋さんに行って、下記の本を買うことで事なきを得ました。ちなみに、宿題の点数はそんなに良くはなかったですが、そこまで悪くもなかったです。(自分が87点で、学部社会学の友達が91点でした)

amazonリンク


このように割と場当たり的な対応で何とかなるので、統計解析の実務よりも基礎をしっかりと学ぶことに時間をかけた方がいいかと思います。もちろん仕事や学部でかなりがっつり、PythonやRを学習した経験のあるという人は引き続きそのツールを勉強してもいいと思います。

少し話がそれるのですが、研究者や大学院生の友人に話を聞くと、だいたいの人が「Pythonがおすすめ。いろいろと応用がきくから」というのですが、実際に使っている人はあまり見たことがありません。学部の後輩や研究室の先輩はRを使っていますし、他大学から北京大学に来た修士課程の子や北欧で博士課程在籍中の友人はStataを使っています。多分、Pythonは学習コストが高く、みんな手を出せないからだと思っています。
※ここも何か知っている人があれば、教えてください。

どうしても実践的に学びたい人は下記の本を読むのがいいと思います。

amazonリンク

統計や定量分析の本には珍しく、法学部の先生が書いています。数式もほとんど使われずに定量分析でよく使われる手法をわかりやすく説明してくれています。副題のつけ方や文章がユーモアにあふれています。内容としては、実証分析の心構えや落とし穴から始まり、重回帰分析や仮設検定といった基本的な内容を経て、最後はRCTやマッチング、DD、固定効果法(FE)、操作変数法(IV)などの実証研究でよく使われる手法の説明までしてくれます。読みやすいので、疲れた時の読書としても有用です。


統計学の勉強方法に関しては以上となります。
次はいよいよ最後の記事ですね、、、
ひょっとするとこの長いマガジンをすべて読んでくれた方もいるかもしれませんが、次でいよいよおしまいとなります。

最後は「指導教官の選定」について書いていきたいと思います。

引き続きよろしくお願いします

いいなと思ったら応援しよう!

この記事が参加している募集