見出し画像

DS検定の試験範囲をまとめてみたよ!

ハローワールド! データサイエンス VTuber のアイシアソリッドです!

画像16

(右が私! いつかどこかで撮った思い出の写真)

この記事では、この夏第1回が行われるDS検定の試験範囲のまとめと、その対策を記した note です。

申込みはこちらから! → データサイエンティスト検定™ リテラシーレベル | 一般社団法人 データサイエンティスト協会

DS検定とは

データサイエンティスト協会がこの夏、世界に送り出す感動の超大作!
データサイエンティストに関する検定です。
データサイエンスの実務において必要な基礎的知識が網羅的、かつ、体系的に問われる検定となっており、初学者から、自力で現場で頑張ってきた人の基礎固めまで、多様な用途で受験できる素敵検定です!

紹介動画を出したよ!

対策生放送のアーカイブもあるよ!

試験範囲はこんなかんじ

スキルチェックリストの3カテゴリ(データサイエンス力、データエンジニアリング力、ビジネス力)の★1(見習いレベル)相当と数理・データサイエンス・AI(リテラシーレベル)におけるモデルカリキュラムを総合した範囲
※詳細は「データサイエンティスト検定™の試験範囲」を参照

検定の公式ページより引用)

つまり、
スキルチェックリストの★とモデルカリキュラムの一部分が試験範囲です。
詳細はリンク先を見るのが良いでしょう!

下に詳細を記します。

対策方法

試験範囲のキーワードを見て、知らないものがあったら調べる!
これが一番基本的、かつ、良い方法だと思います。

ほか、無料のオンライン教材もあるので、それを利用してもいいかも!

試験範囲 - スキルチェックリスト編

便利なビューワーを使うか、 GitHub のリストを使うと、試験範囲の確認が楽です!

このサイトに遷移して、検索窓に「★」と入れて検索すると、★(見習いレベル)のスキルのみを抽出できます!
その後、「すべて展開」を押すと、一覧で見られます!

==========

または、 GitHub においてある、 csv ファイルをダウンロードして、「★」のみを抽出すると良いでしょう!

ビジネスの csv | サイエンスの csv | エンジニアの csv 

==========

または! 私が公開しているこの spreadsheet をいい感じに利用してください。
※公開されているものなので、変なこと書き込まないようにね! コピー or DL して使ってね!

以下は、ビューワーの「★」のスキルのスクショです(文字が潰れて読めないかも)

ビジネス

画像1

画像2

画像3

サイエンス

画像4

画像5

画像6

画像7

画像8

画像9

画像10

エンジニア

画像11

画像12

画像13

画像14

画像15

試験範囲 - モデルカリキュラム編

モデルカリキュラムで定義されている項目のうち、一部分が試験範囲になってますよ!
検定の公式ページの下部に書いてあります。それのコピペです。)

1.社会におけるデータ・AI利活用
1-1.社会で起きている変化 ・ビッグデータ、IoT、AI、ロボット
・データ量の増加、計算機の処理性能の向上、AIの非連続的進化
・第4次産業革命、Society 5.0、データ駆動型社会
1-2.社会で活用されているデータ ・調査データ、実験データ、人の行動ログデータ、機械の稼働ログデータなど
・1次データ、2次データ、データのメタ化
・構造化データ、非構造化データ(文章、画像/動画、音声/音楽など)
・データ作成(ビッグデータとアノテーション)
・データのオープン化(オープンデータ)
1-3.データ・AIの活用領域 ・データ・AI活用領域の広がり(生産、消費、文化活動など)
・研究開発、調達、製造、物流、販売、マーケティング、サービスなど
・仮説検証、知識発見、原因究明、計画策定、判断支援、活動代替、新規生成など
1-4.データ・AI利活用のための技術 ・データ解析:予測、グルーピング
・データ可視化:関係性の可視化、地図上の可視化、挙動・軌跡の可視化、リアルタイム可視化など
・非構造化データ処理:言語処理
1-5.データ・AI利活用の現場 ・流通、製造、金融、サービス、インフラ、公共、ヘルスケア等におけるデータ・AI利活用事例紹介
1-6.データ・AI利活用の最新動向 ・AI等を活用した新しいビジネスモデル(シェアリングエコノミー、商品のレコメンデーションなど)
・AI最新技術の活用例(深層生成モデル、敵対的生成ネットワーク、強化学習、転移学習など)
2.データリテラシー
2-1.データを読む ・データの分布(ヒストグラム)と代表値(平均値、中央値、最頻値)
・観測データに含まれる誤差の扱い
・相関と因果(相関係数、擬似相関、交絡)
・母集団と標本抽出(国勢調査、アンケート調査、全数調査、単純無作為抽出、層別抽出、多段抽出)
・統計情報の正しい理解(誇張表現に惑わされない)
2-2.データを説明する ・データの図表表現(チャート化)
・データの比較(条件をそろえた比較、処理の前後での比較、A/Bテスト)
・不適切なグラフ表現(チャートジャンク、不必要な視覚的要素)
・優れた可視化事例の紹介(可視化することによって新たな気づきがあった事例など)
2-3.データを扱う ・データの集計(和、平均)
3.データ・AI利活用における留意事項
3-1.データ・AIを扱う上での留意事項 ・個人情報保護、EU一般データ保護規則(GDPR)、忘れられる権利、オプトアウト

最後に一言

頑張ってね!

申込期間
2021年7月1日(木)AM10:00~2021年8月29日(日)
なので、お早めに!

試験期間
2021年9月11日(土)~2021年9月30日(木)
です!

申込みはこちらから! → データサイエンティスト検定™ リテラシーレベル | 一般社団法人 データサイエンティスト協会

※2021/08/06 21:06 時点の情報です。最新の情報は公式サイトを確認してください。

あ、チャンネル登録よろしくおねがいします!


いいなと思ったら応援しよう!