見出し画像

Polars null sortの挙動について

Polarsの挙動調査

nullがあった際にsortした際の挙動

# 1. データフレームの作成
import polars as pl

df = pl.DataFrame({
    "a": [1, 2, 3, None, 5],
    "b": [1, 2, 3, 4, 5]
})

# 2. sort 昇順
df.sort("a", descending=False)
# 降順
df.sort("a", descending=True)

nullがあると必ず一番上に来てしまうので注意が必要

ちなみにpandasは

# pandasでも確認する
import pandas as pd

df = pd.DataFrame({
    "a": [1, 2, 3, None, 5],
    "b": [1, 2, 3, 4, 5]
})

df.sort_values("a", ascending=False)

df.sort_values("a", ascending=True)

pandasに慣れていると思わぬところで落とし穴に引っかかるかも

まぁsortする前にnullのデータの確認しろよっていう話でもあるけど。
書き捨てのやつでやっていると人間甘えが出ちゃって怠惰になるものなので・・・

いいなと思ったら応援しよう!