仕事しながら1ヶ月半でデータサイエンティスト検定リテラシーレベルに合格した話
2023年11月に実施されたデータサイエンティスト検定リテラシーレベルに合格したので、合格にむけてどのような勉強をしてきたかとまとめて紹介したいと思います。この検定を受けようと考えている方にとって良い情報となれば幸いです。
試験結果
スコアシートの正答率は次の通りです。
データサイエンス:77%
データエンジニアリング:76%
ビジネス:90%
総合得点:360点
私のスペック
本業はメーカでの勤務で、化工計算、産業機械設計、プラントエンジニアリング、素材研究開発などを担当しています。また、基本情報技術者の資格も取得しています。
数学/統計学:
研究開発で統計評価を行ったり、製品の品質管理の部分で評価ツールとして使っている程度です。
機械学習:
機械学習の経験はほとんどありません
ビジネス:
企画やプロジェクトを進めていくうえで用いられる法律用語を知っている程度です。IT業界で用いられる用語は知識として持っていません。
試験を受けた動機・モチベーション
会社の中でデータを取り扱うための勉強会や無料講習などが福利厚生であったので、興味があったので受けていました。受けただけではそこで終わってしまうので、勉強した内容を清算する意味で試験を受けることにしました。
試験勉強をしている時だけでなく合格した後も同じ考えを持っています。それは「この資格を持っていても特に意味はない」という事です。
国家資格ではないので、この資格をもっているだけで給料が上がったり就職・転職に役立つものではありません。
内容も、具体的なスキル(例えばMIの解析評価で上長を納得させられる)というものではなく、知識として身に着ける部分がおおいです。リテラシーを測る検定です。
SQLの使い方もこの検定で習得できますが、こういった内容は反復で使っていかないといけないものなので、知識をもっているだけは使えません。
ではなぜ資格取得に動いたのかというと、自分に新しいラベルを付けるためです。このラベルを持っていると「あ、この人はこういうジャンルがすきなんだな」とか「この方向性に進みたいんだな」などを細かく説明せずに表現できる、という所に興味がありました。
データサイエンティスト検定とは?
『データサイエンティスト検定™ リテラシーレベル』(略称:DS検定® ★)とは、アシスタント・データサイエンティスト(見習いレベル:★)と数理・データサイエンス教育強化拠点コンソーシアムが公開している数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを総合し、実務能力と知識を有することを証明する検定です。
という風な位置づけです。ちょっとわかりにくいですね。こちらのほうがイメージしやすいかと思います。
という位置づけのようです。
つまりIT関連の知見を持っている、という検定にしてしまうと横断的なジャンルになってしまい、資格の趣旨がぼやけてしまいます。ですので3つのカテゴリーに分け、その中でもデータサイエンティスト検定は線形代数や数理・統計・データ処理に焦点を当てた検定となっているようです。
だからといって2元配置分散分析や母平均の差の推定計算などは出題範囲に入っていません。
だからといってAIやLLM、深層学習の範囲は出題範囲に含まれないことではありません。
そういう意味からも、統計学/深層学習どちらにも舵を切りきっていないため、これを合格すればすべて網羅されるわけではないことを留意することが望ましいと思います。
受験方法
受験会場でPC上で回答するCBT方式です。試験終了後即点数が出る点が良いですね。
30分前に到着して”早く着いたから先にエントリーだけ済ませよう”としても受け付けてくれません。決められた時間しかエントリーはできませんので注意してください。
受験会場はさまざまな試験が行える場所なので時間厳守なんだと思います。
出題範囲 スキル一覧
若い検定であり、かつこの分野は情報更新も早いので出題範囲は頻繁に変わるようです。最新の出題範囲と自分が受けようとしている時期の出題範囲はかならずチェックしてください。
https://www.datascientist.or.jp/common/docs/skillcheck_ver5.00_simple.xlsx
選んだ参考書と問題集とサイト
まずおさえてほしいのが、データサイエンティスト検定の対策は、本一冊買えばすべて網羅されるという段階に達していないということです。まだ始まったばかりの検定ですので十分でかつまとまった情報が世に出回っていません。
とはいえさまざまなジャンルで十分まとめられているので、それらをかいつまんで勉強する、というスタイルになります。
最短突破 データサイエンティスト検定 公式リファレンスブック
通称白本
勉強するにあたっての指針が必要ですので、こちらの本の購入を推奨します。ただタイトル通り「リファレンス」ですので、これを読むだけでは合格は難しいのではないかと思います。
評判どおり助詞の位置と種類、それと主語と動詞の位置がわるい文章がややおおく、日本語がおかしく読みにくいです。
巻末に模擬45問、購入者特典で模擬90問が用意されています。
徹底攻略データサイエンティスト検定問題集
通称黒本
こちらを最もよく使っていました。問題の数も多いです。解説も充実しており、白本では薄く紹介されている用語も解説の補足で紹介されていますので正解した問題であってもしっかり解説を読むことを推奨します。
巻末に模擬90問が用意されています。
こちらの本も解説の日本語やおかしく読みにくいところがあります。
合格対策データサイエンティスト検定 教科書
通称緑本
黒本を3周ほど回して問題を解いていましたが、汎化性能が落ちてきてしまうので、試験2週間前に購入しました。問題のジャンルが黒本と体感7割重複しています。勉強のしかたによっては購入する必要がない、という方がいてもおかしくはないでしょう。
問題の数は少ないですが、巻末に模擬90問が用意されています。
スキルアップAI DS検定リテラシーレベル対応 データサイエンティスト基礎講座
無料で受けれる勉強動画講座です。黒本の著者の一人が講師です。白本だけでは不十分だと思うので、受講を推奨します。
特にSQLを使ったことがない方はこの講座を受けることを強く推奨します。
SQLトレーニングサイト SQLab
無料でSQLのイロハを学べます。ブラウザ上で動くためSQLの動作環境を準備する必要がありません。
情報数理科学VII
東京大学の松島 慎先生の講義を無料で閲覧できます。機械学習のジャンルを学べます。大学1年生を対象とした講義ですので、うわべの説明ではなく本質的な部分を含め説明されているので理解しやすいです。ただし数学自体が苦手という方にとってはハードルが高いかもしれません。
資格の出題範囲は超えませんが、同じクオリティの問題はでないでしょう。
ヨビノリ 線形代数(Youtube)
白本単体で線形代数すべて理解できると思わないほうがよいです。このヨビノリの線形代数学を推します。
統計WEB/統計の時間
白本や出題範囲を見ながら該当する項目の統計学をこのサイトで学びます。私が合格した時の範囲は記述統計学(順列組み合わせや条件付確率、ベイズの定理)や標本抽出方法、離散分布や連続分布などが範囲でした。計算させる問題は少なく定理を知っているかを問う問題が多いように感じました。
微分式
積分も出ますが、微分を知っていれば逆も出来るようになるので、まずは微分ですね。微分は出題範囲が曖昧だと感じてます。wikiにある「初等函数の微分」表内の、sin/cos/tanの微分までは計算できるように準備しておいたほうがいいと思いました。arcsinまでは出ないんじゃないでしょうか?正直良くわかりませんので出題範囲を確認しながら覚える範囲を決めたほうがいいと思います。
基本情報技術者試験の出題範囲
補足的な項目になりますが、基本情報技術者試験も今後うけようと思っている方であれば、こちらの記事を一読することを推奨します。
データサイエンティスト検定でも秘密鍵・公開鍵の分野およびビジネス用語の範囲は出題範囲ですので、まとめて勉強すると時短にもなってお得です。
要した勉強時間
約82時間
1日2時間勉強したとすると約41日分となります。約1か月半です。
勉強方法
Notionでガントチャートを作ってから勉強スタートしました。どんな試験や資格でもそうですが、試験日から逆算していつまでに何をしておきたいのかのスケジュール管理がとても重要です。
問題集で間違った所や勉強したところをNotionでまとめておいて、模擬で間違えた問題の振り返りをワード検索機能を使って行います。
試験所感
自動車学校のテストのように、「該当しないものを選べ」「適切でないものを選べ」「不適切なものを選べ」「ふさわしくないものを選べ」が非常に多いです。問題の最後まで必ず読みましょう。
出題数は模擬と同じ約90問です。時間も十分あり、おそらく余裕をもって解ける人が多いと思いますので、振り返りをする時間はあると思います。
PC画面上で簡易の四則演算のみ電卓が使えます。使いましたが、クリックで電卓の数字ボタンを押すしかできません。手計算のほうがやりやすかったです。
大事なことですが、出題範囲から逸脱しない程度で白本に掲載されていない単語用語も出ます。若い検定なので、受験者の傾向や今後の問題傾向を調査するために入っていると推測されます。
知識として持っておらず推測も出来なさそうならすぐにあきらめて次に進みましょう。
さいごに
この試験に合格した後も実践経験を積まないと、意味をなさない検定です。経験が非常に重要なジャンルですので、自分自身へも言えることですが合格後は、Kaggleのようなプラットフォームでプロジェクトに取り組むことをお勧めします。実際のデータサイエンスの問題を解決する経験は、理論知識を実践的なスキルに変えるのに役立ちます。
この記事が気に入ったらサポートをしてみませんか?