【python初心者】pandasで取得したデータから不要な部分を削除する

pandasによってDataFrame型で返ってきた値の中で、数値列なのに文字列などが入っている等で列を消したい場合に変換して削除する方法

data[0]["変換したい列"] = pd.to_numeric(data[0]["変換したい列],errors="coerce")
data[0].dropna(inplace=True)

列の値を数値型に変換する処理で、変換できない場合Nanに変換

そのあとNan列を削除

#pandasのインポート
import pandas as pd

#調べたいurl
url = "https://~~~~~~"

#header=0でテーブルの一番上の部分がヘッダとなる
data = pd.read_html(url,header=0)

#pandas.to_numeric(args,errors)とは指定した要素の変換
#args    → 変換したいSeries、list 必須
#errors → エラー発生時の処理
#raise   →  例外を発生させる 未指定の場合これ
#coerce  →  Nanに変換
#ignore  →  数値変換を行わない
data[0]["変換したい列"] = pd.to_numeric(data[0]["変換したい列],errors="coerce")

#Nanの行を削除する
#inplace = Trueにすると実行結果が保存される。falseはされない
data[0].dropna(inplace=True)

#結果の表示、headで先頭、tailで末尾から
data[0].tail()

いいなと思ったら応援しよう!