ETLツールを選ぶ_Alteryxについて
はじめに
1,ETLツールの使いどころ
BIツールに提供するためのデータ、EXCELでレポートしているデータにかかわらず、データ業務に関わる方々は、ピボットして、アンピボットして、集計して、加工して、JOIN、UNION、そしてコピー&ペーストを繰り返していると思います。
こうした作業を改善してくれるのがETL(Extract・Transform・Load)ツールです。お金はかけたくないところではあるかと思いますが、こうしたツールを利用することは圧倒的に作業時間を削減できます。実際、私の仕事においても、大幅な導入効果を得ることができました。スタッフのQOLも上がります。
ETLツールを使わないともったいないと思います。
私もいろいろツールを試して検証してきました。またツールも進化したり変わってきています。
最近のおすすめは Power BI + Alteryx の組み合わせです。お互いの強みが生かせますし、弱い部分を補完してくれます。(Power BIはMSの環境に適しており、デスクトップが無料です。基本的なBI機能はそろっています。一方データ準備のPowerQueryは使いにくい&機能が不足するので Alteryx の使用でPower BI で表現ことも大きく向上します)
2,Alteryxについて
Alteryxの代理店は日本国内にもたくさんいらっしゃいますし、Alteryxサイトよりも各社わかりやすいご説明いただいておりますので私が説明するよりもそれぞれまとめサイトのように掲載しておきたいと思います。また具体的な使い方を紹介してくださるサイトも運営・紹介いただいているので合わせてご紹介します。もちろんライセンス1つからでも購入可能です。
・クラスメソッド社
・NTTデータ社
伊藤忠テクノソリューションズ
京セラみらいエンビジョン社
パナソニック
3,Alteryxを使うメリット
Alteryxのツールの詳細な使い方については、ベンダーの皆さんがご提供くださっているので(いつも参考にしています。)私の記事はユーザー目線での評価を記載します。
・落ちない/処理スピードが速い
Tableau Prepも優秀なETLツールに進化していますが、最近使用しても固まることがありました。「落ちない/処理スピードが速い」ということは、基本中の基本の性能です。
・何でも繋げる/出力できる
ETLとしては当然かと思いますが、どのようなデータベース・ファイル形式に対応しています。個人的には、Alteryxの独自のデータファイル形式yxdbで保存できること(中間データの処理速度が格段に上がります)。TableauのHyper形式のファイル出力ができる点が需要にマッチしています。
・チェック/確認しやすい
大量のデータ処理を行っていると、途中で思ったものと違う加工やフィルタをしてしまっていることがあります。どこで間違ったのか、何が悪さをしているのか確認をしたいのですが、都度SQLを書いたり、ピボットしたり、ローデータでフィルタをかけるのは時間も手間もかかります。
Alteryxの場合は各作業ツールの前後でデータカウントがされているので、さらに各ツール上でローデータを確認できるようになっていますので、どの工程で思った以上にフィルタがかかってしまったのかが探しやすくなっています。
・マクロを作れる
業務改善で最初に手を付けるポイントが、「繰り返し作業している」ことをいかに減らせるかだと思います。Alteryxは繰り返し処理をマクロとして、他のフローで使うことができます。ほかの人とシェアすることも可能です。追って記事にしたいと思いますが私が参考とさせていただいたブログをご紹介しておきます。
・楽しい
何よりも、サクサク使えて、やりたいことが実現できるので楽しい。
是非これをご覧になった方も、無料トライアルなどお試しになってみてください。