[データエンジニア]Dataiku Advanced Designerに合格した話
今回は、Dataikuにおける上位資格のAdvanced Designer に挑戦したので、体験談をまとめたいと思います。前回のML Practitionerはデータサイエンティスト寄りの内容でしたが、Advanced Designerは完全にデータエンジニア向けの内容でした!
以前に取得した資格の体験談はこちら👇
Dataiku Advanced Designer とは
Dataikuの資格は5種類あり、Dataiku Advanced Designer の資格はその中核となるレベルに位置しています。受験に際してはCore Designerに合格していることが条件になります。
受験までの準備
Dataikuでは、各資格に対応する形でラーニングパスが用意されています。(すべて無料)
ここからAdvanced Desginer を選択し、必須コースにそれぞれ取り組みます。コース内では動画閲覧・小クイズ・ハンズオンが用意されています。
Advanced Desginer のラーニングパスでは、より実践的にデータエンジニアリングの観点から、
ウィンドウ関数、正規表現、ピボット、上位・下位ランクの抽出
Dataikuフローの整理の仕方
プロジェクト変数・プラグイン
自動化(メトリクス、チェック、シナリオ)など
について学びます。
認定試験の受験にあたっては、上記のハンズオンで学んだ内容がまんべんなく出題されます。(データセットは認定試験用に新たに提供されます。)
出題内容は認定試験用のハンズオンを行わないと回答できない問題が40%くらい、残りの60%くらいが関連する機能の正誤などに関する出題でした。
あると便利な事前知識
Advanced Designerではデータ加工・データ準備の分野を学ぶことになります。以下のような経験があるとスムーズに学習を進められると思いました。
エクセルで関数を使って集計・ピボットした経験
SQLの経験
データ準備ツールの経験(Alteryx, Talend, Tableau, Informatica, Qlick, Sagemakerなど)
データパイプラインの設計・運用経験
学んだこと
Dataikuは機械学習プラットフォームとしてだけではなく、データ準備ツールとしても本番運用が可能な強力な製品であることが分かりました!
特に実際の業務では、一度フローを作って終わり、ではなく日々新しいデータをフローに通して加工することになります。その際にデータ品質のモニタリング・検証のために使えるメトリクス、チェック、シナリオの存在はとても心強いと思いました。
ハンズオンの動画があると嬉しい。
ラーニングパスにてコンセプトの学習部分では動画が用意されていますが、ハンズオンはほぼ完全にテキストベースです。ひたすら文章を読んで(しかも英語)自分の環境で試す、というのはなかなか大変でした。Dataikuのインターフェースに慣れてないので、どこをクリックしたらよいか分からないシーンも多くありました。
無料でラーニングパスを提供して頂けているだけでもありがたいですが、動画が難しくても、せめてもう少しスクリーンショットを増やしてもらえるともっとスムーズに進められるなと思いました。
解答の解説が欲しい。
私の理解が及んでいないというのが一番の理由なのですが、全体を通して、何度チャレンジしても正答が分からない問題がいくつかありました。Dataiku公式ドキュメントのどこに記載のある内容かも分からなかったので、解答には一言でもいいので解説、または公式ドキュメントの参照リンクがあると嬉しかったです。
プラグインが上手くいかない…
Advanced Designerの最終試験では、必須のプラグインがあるのですが、私の場合はインストール + 有効化まではうまくいってるはずなのに、フローのアクションには出てこない、という状況になりました。多分私のやり方が悪かったのだと思いますが、同じ状況になった方のために書き残しておきます。(これが理由で、1問どうしても解けなかったので、他の問題で点数を稼ぐ必要がありました😂)
以上となります。
個人的にはAdvanced DesignerはこれまでのDataikuの資格の中で一番大変でしたが、この資格習得を通して、Dataikuのデータエンジニアリングツールとしての強みが理解できて良かったです。ご興味のある方の参考になれば幸いです!
最後までお読みいただきありがとうございました!
スキ・フォローよろしくお願いします☺