見出し画像

集計集約操作におけるROLLUP,GROUPING SETS,CUBEをTypescriptで実現するやり方

はじめに


こんにちわ。nap5です。


集計集約操作におけるROLLUP,GROUPING SETS,CUBEをTypescriptで実現するやり方の紹介です。


SQL操作でよく出てくるGroupBYの亜種になります。

サンプルデータ


このデータをもとにTidyjsで集計集約操作をしていきます。


  type Sale = {
    city: string;
    product: string;
    amount: number;
  };

  const sales: Sale[] = [
    { city: "Tokyo", product: "Apple", amount: 10 },
    { city: "Tokyo", product: "Banana", amount: 20 },
    { city: "Osaka", product: "Apple", amount: 15 },
    { city: "Osaka", product: "Banana", amount: 5 },
  ];



Group by rollup

期待される結果の集計は次のようになります。明細単位の集約(semiTotal)は一件にするため、Sumしています。集約できれば、Maxでも、Minでもいいかとは思います。

  • 全都市、全商品の合計:50

  • 東京の合計:30

  • 大阪の合計:20

  • 東京のリンゴの合計:10

  • 東京のバナナの合計:20

  • 大阪のリンゴの合計:15

  • 大阪のバナナの合計:5

import { describe, test, expect } from "vitest";
import { bind, bindTo, map } from "fp-ts/lib/Identity";
import { pipe } from "fp-ts/lib/function";
import { groupBy, summarize, tidy, sum } from "@tidyjs/tidy";

describe("グルーピング", () => {
  type Sale = {
    city: string;
    product: string;
    amount: number;
  };

  const sales: Sale[] = [
    { city: "Tokyo", product: "Apple", amount: 10 },
    { city: "Tokyo", product: "Banana", amount: 20 },
    { city: "Osaka", product: "Apple", amount: 15 },
    { city: "Osaka", product: "Banana", amount: 5 },
  ];

  // @see https://docs.snowflake.com/ja/sql-reference/constructs/group-by-rollup
  test("GROUP BY ROLLUP", () => {
    const outputData = pipe(
      sales,
      bindTo("input"),
      bind("semiTotal", ({ input }) =>
        tidy(
          input,
          groupBy(
            ["city", "product"],
            [
              summarize({
                amount: sum("amount"),
              }),
            ]
          )
        )
      ),
      bind("subTotal", ({ input }) =>
        tidy(
          input,
          groupBy(
            ["city"],
            [
              summarize({
                product: (d) => "All Products",
                amount: sum("amount"),
              }),
            ]
          )
        )
      ),
      bind("total", ({ input }) =>
        tidy(
          input,
          summarize({
            city: (d) => "All Cities",
            product: (d) => "All Products",
            amount: sum("amount"),
          })
        )
      ),
      bind("output", ({ total, subTotal, semiTotal }) => ({
        summary: total.concat(subTotal).concat(semiTotal),
        detail: {
          total,
          subTotal,
          semiTotal,
        },
      })),
      map(({ output }) => output.summary)
    );
    expect(outputData).toStrictEqual([
      {
        city: "All Cities",
        product: "All Products",
        amount: 50,
      },
      {
        city: "Tokyo",
        product: "All Products",
        amount: 30,
      },
      {
        city: "Osaka",
        product: "All Products",
        amount: 20,
      },
      {
        city: "Tokyo",
        product: "Apple",
        amount: 10,
      },
      {
        city: "Tokyo",
        product: "Banana",
        amount: 20,
      },
      {
        city: "Osaka",
        product: "Apple",
        amount: 15,
      },
      {
        city: "Osaka",
        product: "Banana",
        amount: 5,
      },
    ]);
  });
});





Group by grouping sets

期待される結果の集計は次のようになります。明細単位の集約(semiTotal)は一件にするため、Sumしています。集約できれば、Maxでも、Minでもいいかとは思います。


  • 東京の全商品の合計:30

  • 大阪の全商品の合計:20

  • 全都市のリンゴの合計:25

  • 全都市のバナナの合計:25

  • 東京のリンゴの合計:10

  • 東京のバナナの合計:20

  • 大阪のリンゴの合計:15

  • 大阪のバナナの合計:5


import { describe, test, expect } from "vitest";
import { bind, bindTo, map } from "fp-ts/lib/Identity";
import { pipe } from "fp-ts/lib/function";
import { groupBy, summarize, tidy, sum } from "@tidyjs/tidy";

describe("グルーピング", () => {
  type Sale = {
    city: string;
    product: string;
    amount: number;
  };

  const sales: Sale[] = [
    { city: "Tokyo", product: "Apple", amount: 10 },
    { city: "Tokyo", product: "Banana", amount: 20 },
    { city: "Osaka", product: "Apple", amount: 15 },
    { city: "Osaka", product: "Banana", amount: 5 },
  ];

  // @see https://docs.snowflake.com/ja/sql-reference/constructs/group-by-grouping-sets
  test("GROUP BY GROUPING SETS", () => {
    const outputData = pipe(
      sales,
      bindTo("input"),
      bind("semiTotal", ({ input }) =>
        tidy(
          input,
          groupBy(
            ["city", "product"],
            [
              summarize({
                amount: sum("amount"),
              }),
            ]
          )
        )
      ),
      bind("subTotal1", ({ input }) =>
        tidy(
          input,
          groupBy(
            ["city"],
            [
              summarize({
                product: (d) => "All Products",
                amount: sum("amount"),
              }),
            ]
          )
        )
      ),
      bind("subTotal2", ({ input }) =>
        tidy(
          input,
          groupBy(
            ["product"],
            [
              summarize({
                city: (d) => "All Cities",
                amount: sum("amount"),
              }),
            ]
          )
        )
      ),
      bind("output", ({ subTotal1, subTotal2, semiTotal }) => ({
        summary: subTotal1.concat(subTotal2).concat(semiTotal),
        detail: {
          subTotal1,
          subTotal2,
          semiTotal,
        },
      })),
      map(({ output }) => output.summary)
    );
    expect(outputData).toStrictEqual([
      {
        city: "Tokyo",
        product: "All Products",
        amount: 30,
      },
      {
        city: "Osaka",
        product: "All Products",
        amount: 20,
      },
      {
        product: "Apple",
        city: "All Cities",
        amount: 25,
      },
      {
        product: "Banana",
        city: "All Cities",
        amount: 25,
      },
      {
        city: "Tokyo",
        product: "Apple",
        amount: 10,
      },
      {
        city: "Tokyo",
        product: "Banana",
        amount: 20,
      },
      {
        city: "Osaka",
        product: "Apple",
        amount: 15,
      },
      {
        city: "Osaka",
        product: "Banana",
        amount: 5,
      },
    ]);
  });
});





Group by cube


期待される結果の集計は次のようになります。明細単位の集約(semiTotal)は一件にするため、Sumしています。集約できれば、Maxでも、Minでもいいかとは思います。


  • 全都市、全商品の合計:50

  • 東京の全商品の合計:30

  • 大阪の全商品の合計:20

  • 全都市のリンゴの合計:25

  • 全都市のバナナの合計:25

  • 東京のリンゴの合計:10

  • 東京のバナナの合計:20

  • 大阪のリンゴの合計:15

  • 大阪のバナナの合計:5





おわりに


Tidyjs便利です。簡単ですが、以上です。



いいなと思ったら応援しよう!