統計学の専門家になりたい人々に向けて

このnoteでは、2024年現在、統計専門家になるために必要な知識を、(私のなりに)整理した上で、同じような悩みを持つ方々もおられるのではないか思い、記事にしました。


1.私の背景情報

私は、理系の大学院を修了し、データサイエンスを仕事としています。具体的な仕事内容は伏せますが、データの取得計画~解析結果の報告までの業務を担当しております。

2. 統計専門家になるには?

統計専門家になるために、下記のような知識が必要になると思っています。

  1. 数理統計学の知識

  2. データの取得を考えるための実験計画の立案と提案

  3. データ加工技術と帳票作成スキル(プログラミング技術)

  4. パッケージや関数の使い方

  5. コミュニケーション能力、マネジメント能力、文書作成能力

  6. 新しい統計方法論を提案できる研究能力

  7. etc

 統計学の専門家として、統計検定1級の数理を合格できる程度の数理統計学の知識は必要だと考えています。実務では、RやPythonの関数にデータを入力することで解析結果を出力することが多いです。しかし、それらの結果の解釈を説明して文書としてまとめることは当然として、どのようにモデルの推定や検定が実施されているか、専門家として理解しておく必要があります。また、データサイエンスの手法を適用するためには、前処理とよばれる解析データセットの作成と解析帳票の作成に多くの時間を費やします。そのため、データサイエンスの専門家として、プログラミングスキルは必須となります。プログラミング言語については、各社の事情があると思いますので、(可能であれば様々の)プログラミング言語の知識は必須です。
 また、実務では組織の全員が統計専門家ではありませんので、非専門家の人々とのコミュニケーション能力、統計専門家を束ねるマネジメント力、各種文書の作成能力が求められています。

3.研究能力のある統計専門家として

1~5が出来る人材が社会で活躍できる統計専門家になれるのではないかと思っています。私はそこに1つ加えて、新しい統計方法論を提案できる研究能力のある人材になりたいと努力をしています。新しい方法論が日々論文として公表されています。これらの方法論を理解し実装する力や、自分で新しい方法論を提案できる能力を身に着けたいと思っています。そのために、基礎的な数理統計を理解した上で、既存のモデルをRやPythonを利用してフルスクラッチできる能力が求められていると思っています。すぐにできるようにはならないので、1つ1つ、簡単な解析手法から自分で手を動かしていきたいと思います。

多くの書籍は、RパッケージやPythonのライブラリを解説した書籍が多く、”理解した気になれる本”が溢れています。もちろん、実務上は有益で必要な知識ですが、6.研究能力のある統計専門家になるためには、それらの本では知識は増えません。その時に参考なるのは、大阪大学の鈴木先生が執筆されている”機械学習の数理100問シリーズ”です。これらの本は自らが数式を導き、R言語もしくはPythonのソースプログラムを記述して具体的に手を動かして学ぶことができます。まずは、この本を利用して、必要な数学的知識、プログラミング知識を整理しながら、統計の専門家として活躍していってほしいと思います。私も少しずつ読んでいます。