データ探索型最強BIツールQlik製品の特徴をまとめてみた
私が以前使っていたBIツールQlik をご紹介します。
答えはないけどデータを高速にチェックしたいなど「探索型の可視化」に強い(使わない手はない)製品です。
まとめ
・セルフサービス型の分析ツールとしてTableauと似ている
・A/Bテスト、答えのないデータ探索において最強
・ライセンスが少し高い点とメモリを消費する点からメンテナンスが重要
Qlikブランド
Qlik Tech社のBIツールはQlik SenseとQlikViewの2つの製品があります。
基本的な分析機能は一緒で細かいレイアウトやマクロで作りこむのがQlikView。セルフサービスに特化してシンプルかつ使いやすいのがQlik Senseという認識です。
Qlik製品の特徴
Qlik製品の特徴は3つあります。
1.連想技術
Qlik社が持つ特許技術です。
複数のデータソースを取り込んだ時に、取り込んだ全てのデータに含まれるレコード間の関連付けを自動的に作成・保持する技術です。
この説明だと少し難しいですかね。
通常のBIツールの場合、下記の注文明細を中心に各種マスタデータをJOINしていく形でデータソースが構成されます。
この場合、商品Cを集計すると、商品Cの注文状況を把握できます。
データを探索する場合は「販売アプローチはどうすべきか?」「商品Cの購入先はどうなってる?」「商品の購入先は逆にどんな商品を買っている?」など答えのない仮説検証型のデータ探索がしたいですよね?
通常のBIツールではこれらの仮説検証を簡単に実行できず、AND条件で設定しなおす、集計結果を元にSQLを発行する選択条件をキャプチャで取得してから別の検索条件をかけるなどかなり手間がかかります。
何よりも問題なのは分析が断片的になることです。高速にビジネスを回す必要があるマーケターなどは許容できないと思います。
一方のQlikはというと取り込んだ複数データソース間のリレーションが担保されているため、以下の図のように画面上に可視化したい項目を並べるだけで全ての状況を俯瞰することができます。
商品Cをクリックしただけでどこから仕入れて、いつ、いくら売れて、どの担当がどこに売ったのかが一目瞭然です。
正直言ってめちゃくちゃすごいです。
今仕事で使えないのが苦しいです笑
色でわかりやすく認識できるようになっていて緑が選択値、白が関連値、グレーが除外値です。何が売れていないのかまでグレーで把握できるのもQlikだけです。これもめちゃくちゃすごいです!
一目見るだけでなく人間の思考のような探索が可能です。
思考の例(上記図を参考)
1.商品Cの売れ行きを見たい
操作:商品Cをクリック
2.商品Cで一番売上が高い時期を見たい
操作:選択したまま折れ線グラフを作成して一番売上が高い時期をクリック
3.一番売上が高い時期に一番単価の高い商品を売った営業さんを見たい
操作:現在の選択状態の中で単価の高い数字をクリックして、営業で白くハイライトされているところを見る)
4.その営業さんの今期の成績を見たい
操作:その営業さんをクリック、商品C、年月、単価の選択状態を解除
etc
上記のようにデータを見て考えながらその場で仮説検証ができる唯一のツールだと思います。この思考をするのにQlikを使えば30秒でデータ探索ができると思います!
ポイント1.選択状態を保持
思考例のように一度選択した状態を引き継いだまま集計を続けて行くことができます。しかもTableauでいうところのフィルター設定を一々かける必要がなく、選択するだけで全データが集計されます。
ポイント2.切り口の切り替えが容易
思考例4のように商品カットで集計した結果を元に、人カットに切り替えて集計するなどの人の思考のようなデータ探索が可能です。この他、除外値を選択するような離れ技も可能です。
詳しくはQlik社のブログを参照ください。
2.完全インメモリで高速
Qlik製品はインメモリの製品でして分析に必要なデータを全てBIツール側に取り込みます。データは圧縮してメモリ上に展開するため非常に高速に集計することができます。1億件くらいまでのデータでしたらめちゃくちゃ快適にデータ分析ができます。
3.構築コストが低い
Qlik製品は強力なETL機能とテーブルレイアウトを保有しています。
DWHが綺麗な方が分析はしやすいですが、なるべく早く分析や可視化を進めたい場合にSQLやQlikの関数を駆使することで中間テーブルなしでも分析することができます。Qlikの処理の中で仮想中間テーブルを作成したり、qlik用の中間テーブルファイルを作成したりすることもできます。
ETLツールやDWHなしで素早く構築ができる点が魅力的です。
Tableauと比較した時の強み
これまでご紹介した以外の強みを紹介します。
1.ダッシュボードが作りやすい
Tableauはまず1つのグラフを作って、複数出来上がったらダッシュボードにまとめる仕様です。Qlikの場合はいきなりダッシュボード上にグラフを並べていくことができます。並べながらグラフの組み合わせを試行錯誤できるので手戻りが発生しづらい点が魅力です。特に初心者がTableauを使うと適当にグラフをいくつか作ったけどダッシュボードに並べると関連性がなく使えないダッシュボードになってしまうということがあります。
もう少し言及すると値を集計しながらダッシュボードを作成することができるため分析の効果を確かめながら配置できます。
2.A/Bテストに強い
選択状態Aと選択状態Bのフィルターを横に並べたA/Bテストができます。
条件の切り替えが柔軟なQlikなので仮説検証が捗ります。
3.開発効率が良い
Tableauは複雑な計算をする際にフィルターやパラメータを多数用意します。これが増えるとどこに何を設定したかわからず、属人化しやすくお客様に納品するような場合は極めて危険です。グラフ感のリレーションは自動で張られますし、数式はパーツ化できますし、SET分析、aggr関数、変数を駆使することで複雑な集計が1つの式で完結します。
4.横串分析が強い
分析データ全てにリレーションが張られる特性は取得するテーブルデータが増えるほど威力を発揮します。通常のBIツールはJOINを重ねると極端に集計速度が落ちますが、Qlikは取得済みのデータをメモリで展開しているだけなので高速です。また、通常のBIはテーブルが増えるとその分フィルターを設定する必要があり実装が難しいです。事前に1つのテーブルにまとめるなど必要な場合も多いので、IDデータの横串分析などにはおすすめ。
5.データチェックツールとして使える
ログデータの状況確認や受領したデータをとりあえず見てみるみたいな、データ理解に向いてます。kaggleのデータを理解するとかにも使えます。
Tableauと比較した時の弱み
1.ビジュアライゼーション
Tableauに比べるとビジュアライゼーションの作りこみは弱いかなという印象です。十分見やすいですが、、
Tableauギャラリーのように超綺麗なVIZを作るのは苦手な印象。
2.ライセンス
Tableauと同じようなライセンス体系です。(昔は)
Tableauより少し高い印象(詳しくはお問い合わせください!)
ユーザの人数分お金がかかるため全社展開できる企業は少ない印象
3.リソースコントロールが難しい
分析に使用するデータの分だけメモリを使用します。
GCPやAWSでメモリを柔軟に増強できる環境が望ましいと思います。
例えば、64GBのサーバに32GBのVIZを2つ展開するとメモリオーバーになります。このへんのコントールが上手くいかず少し分析速度が遅くなるケースが多い印象です。
あとがき
最近、note見てますよと言われるようになってきて嬉しいです。
BI関連の記事をまとめていますので是非ご覧ください。
Twitter(@willanalysts)のフォローもよろしくお願いします。
Qlik 製品を検討したい・相談したいというかたいらっしゃいましたら、お気軽にDMください。優秀なエンジニアの方々をご紹介します。