見出し画像

SQL分析データ準備と基礎統計#19:サンプリング

作成されたデータセットを学習用と評価(ブラインドテスト)用に分けるなど、ランダムに複数の行に分ける場合にはサンプリングの機能を用います。単純にsample Nを記載すればNが1つで整数であればその件数分、小数であれば全体の件数におけるパーセント分を取得できます。また複数の値を記載すればその分だけ取得されます。sampleidを列として記載することで、1からナンバリングされた値をセットしてくれます。

もう一つ、ランダム関数を用いる方法もあります。パラメーターに下限値、上限値をセットすることにより、整数値をランダムに振ってくれます。

///

#sql #teradata #analytics

いいなと思ったら応援しよう!