[データサイエンス]Dataiku Core Designer試験に合格した話
今年になってから一気にAI/機械学習の言葉を耳にする機会が増えましたね!AIやML(Machine Learning)といった技術は昔からありますが、それらを日々の業務に落とし込むというビジネス側からのニーズが、ここ最近急激に増えているなというのを肌で感じています。
というわけで、今回はデータサイエンスプラットフォームであるdataikuの資格、"Core Designer"を取得したので、体験談を書いていこうと思います☺こんなホットなツールですが、今なら無料で受験・何度でもチャレンジすることが可能(監督無し)なので、AI/機械学習に興味のある方はぜひチャレンジしてみてください!
ところで無料といえば…
Databricksのエントリー資格も無料で取得できますよ💡
(どこに行ってもお値打ち品LOVEな関西人🤣)
Dataikuとは
DataikuはデータサイエンスにおけるEnd-to-endのプラットフォームです。データ準備、モデル作成、デプロイ・運用および可視化をすべてDataiku上で管理することが可能です。
この6分の動画がとても分かりやすくまとまっているので、Dataikuって何?という方は是非見てみてください!
Dataiku Core Desginer とは
Dataikuの資格は5種類あり(2023/9現在)、Core Designerの資格はそれらの最も基礎となる内容になっています。Core Designerに合格すると、その次のステップとして、さらに機械学習パートを極める ML Practictioner、またはデータエンジニアリングを極めるAdvanced Designer へと進むことができます。
受験のセットアップに関しては、こちらのブログで詳しく紹介されていたので私のnoteでは割愛させていただきます。
受験までの準備
Dataikuは、各資格に対応する形でラーニングパスを準備してくれています。(すべて無料)
ここからCore Designerを選択し、Basics 101, Basics 102, Basics 103のコースにそれぞれ取り組みます。コース内では動画閲覧・小クイズ・簡単なハンズオンが用意されています。
なお、実際のCore Designerの受験にあたっては、サンプルのデータセットを渡されて、そのデータを加工して示唆を読み解くというエクササイズが含まれます。肌感覚ですが、そのエクササイズからの出題が6割くらい、残りの4割くらいがDataikuそのものの価値訴求などに関する出題でした。
あると便利な事前知識
Core Designerの試験で出題される内容は、データ構造の理解、データパイプラインの概要、データの加工方法、可視化、Dataikuにおける用語という感じでした。Core Designerでは機械学習の知識は問われません。
なので、普段からデータ周りに携わっている方、データ準備や可視化をされたことがある方であれば、比較的簡単に取り組める内容になっていると思います!
学んだこと
データ準備ツールはSQLはもちろんのこと, Alteryx, Informatica, Tableauなど色々と市場には出回っていますが、他のツールでできることはDataikuでも一通りできる!ということが分かりました。
これらのツールの違いはUIで、同じ処理だとしても
どれくらい簡単に実装できるか
再利用性があるか
加工履歴を追跡ができるか(監査目的など)
上流・下流工程で実現したいことと互換性があるか
などの観点で選んでいくことが大事だと思いました。
特にデータ準備の観点でDataikuの機能が面白いと思ったのは、IPアドレスから地理的情報(国、州など)を解析できることです。(公式ドキュメント)これはめっちゃ便利ですね!
Dataikuの特徴である機械学習のコンポーネント部分は次の資格(ML Practicitioner)で学ぶことになるので、そこで差別化要因をもっと深く勉強したいと思います!
最後に、、、Dataikuのユーザーさんが、10/1にゆる勉強会を企画されているそうです❤ ご興味のある方は是非!
最後までお読みいただきありがとうございました!
スキ・フォローよろしくお願いします☺