SNOWFLAKE クラスタリング深度

2024年11月5日 21:53

想像してみてください。あなたはたくさんのフルーツを持っています。りんご、バナナ、オレンジなどです。

これらのフルーツを棚にしまいたいのですが、できるだけ同じ種類のフルーツを近くにまとめたいと思っています。

クラスタリングというのは、同じ種類のものをできるだけ近くに集めることです。

たとえば、りんごはりんご同士、バナナはバナナ同士で並べます。

でも、棚が限られているので、どうしても異なるフルーツが混ざってしまうことがあります。

クラスタリング深度は、同じ種類のフルーツがどれくらい離れて散らばっているかを表す数字です。

棚全体を見て、フルーツの種類ごとにどれくらい散らばっているかを平均して計算したものが平均クラスタリング深度です。

データベースのテーブルでも同じように、データが小さなグループ（マイクロパーティション）に分かれています。

いいなと思ったら応援しよう！