見出し画像

[Snowflake] SQL100本ノックのコードをSnowflakeで書き換えてみた (50問目まで)

SQL100本ノックの問題のうち50問目までをSnowflakeで書き換えるとどうなるか見てみました。50問目までだと、大きく書き方が変化する問題はあまりなかったのですが、縦持ち横持ちの変換が柔軟にできる `PIVOT`, `UNPIVOT` はとても便利に感じました (S-044の問題がそれです)。

SQL100本ノックの全問題はこちらを御覧ください
SQL100本ノックの公式の模範解答はこちらを御覧ください

なお、100本ノック用のデータをSnowflakeに入れるのはTroccoを使用しています。
Troccoを使用してデータをSnowflakeのTableに入れるための設定方法はこちらの記事を御覧ください。

[Snowflake] Troccoを使ってS3にあるデータをSnowflakeに転送してみた

S-028

レシート明細データ(receipt)に対し、店舗コード(store_cd)ごとに売上金額(amount)の中央値を計算し、降順でTOP5を表示せよ。

  • Snowflakeでは中央値を計算するための関数 `MEDIAN` があるため、それを使用。

SELECT 
  store_cd, 
  MEDIAN(amount) AS amount_50per
FROM
  receipt
GROUP BY 
  ALL
ORDER BY
  amount_50per DESC
LIMIT 5

S-044

043で作成した売上サマリデータ(sales_summary)は性別の売上を横持ちさせたものであった。このデータから性別を縦持ちさせ、年代、性別コード、売上金額の3項目に変換せよ。ただし、性別コードは男性を"00"、女性を"01"、不明を"99"とする。
問題がわかりにくいですが、このようなデータ構造のものを

こういう構造に変換する問題です

  • Snowflakeでは `UNPIVOT` という、列を行に入れ替える関数があるのでそれを使用。 (参考)

SELECT
  era,
  CASE gender 
    WHEN 'MALE' THEN '00'
    WHEN 'FEMALE' THEN '01'
    WHEN 'UNKNOWN' THEN '02'
  END AS gender_cd,
  amount
FROM
  sales_summary
  UNPIVOT (amount FOR gender IN (MALE, FEMALE, UNKNOWN))
ORDER BY 
  2, 1

S-047

レシート明細データ(receipt)の売上日(sales_ymd)はYYYYMMDD形式の数値型でデータを保有している。これを日付型に変換し、レシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。

  • Snowflakeでは `列名::VARCHAR` という記法でCASTできる。

SELECT  
  receipt_no, 
  receipt_sub_no,
  TO_DATE(sales_ymd::VARCHAR, 'YYYYMMDD') AS sales_ymd
FROM
  receipt 
LIMIT
  10

S-049

レシート明細データ(receipt)の売上エポック秒(sales_epoch)を日付型に変換し、「年」だけ取り出してレシート番号(receipt_no)、レシートサブ番号(receipt_sub_no)とともに10件表示せよ。

  • Snowflakeでは `EXTRACT` を使わずとも `YEAR` で年を取得できる。

  • `YEAR` に限らず `MONTH`, `DAY` なども同じ様に計算できる (参考)

SELECT 
  receipt_no, 
  receipt_sub_no,
  YEAR(TO_TIMESTAMP(sales_epoch)) AS sales_year
FROM receipt 
LIMIT 10;

いいなと思ったら応援しよう!