真魚
メモ
過去で好きな文字たち ベストセラー
2023年の記憶
具体と具体の交わりを見つけるトレーニング
1 数字と文字は結合できないからstr()や""で囲っておなじにしよう 2 りぷれいすとはfindとかデータをまとめて編集や検索できるから 知っているだけで楽になるな 3 "{} + {} = {}".format( x , y , x + y) 数字を指定したら代入する順番を変えられる format側は右からだよ 4 try: print("実行開始") print(a / b ) except: print("エラーです") else: print
1 B これを決めるための下準備 rangeは繰り返し 2 繰り返し 3 While
7/3 1 集合は積集合と和集合がある intersectionhは一つの集合を選んでそれと同じ部分を引き出す感じか &(アンパサンド)は集合1 & 集合2みたいにそれぞれを与えるみたい 7/4 1 演算子 and or よく使うと思う is と==はオブジェクトIDを見て一致しているかどうか違い 2 is はオブジェクトIDが同じならTrue ==は中身が同じならオブジェクトIDが違くてもTrue プロンプト学習 いい命令分見つけたぞ 3 オブジェクト判断のisやリ
聞きたい知りたい学びたいこと 「XXXX」---まず、上記について具体的に、アナロジーや比較・対照などを用いて過去最高にわかりやすく{1.用語の説明}をすることに限界を超えて挑戦してください。続けて、その説明内で使用したその他の専門用語それぞれについて、専門用語を一切使わずにわかりやすく{2.追加の説明}をしてください。#出力フォーマット### 1.用語の説明### 2.追加の説明 「XXXX」について、完全な素人に教えるように、シンプルかつ平易な言葉で、Step by
1 リストの最大最小を調べたり昇順降順に並び替えるができる 2 リストが終わりタプルへ 主な違いはリスト内は追加編集できるが タプルはそれができないみたい 3 タプルとリストの最大最小値の書き方は同じだったが sortとsortedと若干違う部分もある 辞書型は2つとも違い、一意な鍵と値で構成されている 4 辞書型で鍵と値を消したいときは鍵を削除すると紐付く値も消えるよ setという集合では重複がなくなりまとめられる 5 集合=set 追加はadd 削除はremo
1 Pythonの環境構築を行なった 大きく分けて2つ アナコンダインストール>ターミナルからジュピターラボ起動 VSCodeインストール>Ptyhonの拡張機能をインストール ポケモンの世界観で言うとポケモン図鑑を手に入れた 図鑑はポケモンのタイプや生態を知ることができるもの 2 Dockerはまだ早いみたい でも向き合うことも忘れずに 3 変数の基礎 予約語は変数名に使えないよ もう既にPython側で指定している単語はダメ importやbreakとか 4
df.sort_values(by = "idx03" , axis = 1 , inplace = True ) ##元のデータフレームの値を並び替え後の値に変更するには 引数inplaceにTrue 今まではindexひとつに対して昇順降順を並び替えていたが sort_indexではまとめて動かせる df.sort_index(ascending = False) ##indexをまとめて並び替えるにはsort_indexをデフォルトでは昇順 ##降順に並び替えたい場合
import pandas as pd df = pd.DataFrame({'col01':[1, 5, 9, 13, 17], 'col02':[2, 6, 10, 14, 18], 'col03':[7, 3, 19, 11, 15], 'col04':[4, 8, 12, 16, 20]}, index=['idx01', 'idx02', 'idx03', 'idx04', 'idx05']) df.sort_values(by = "idx03" , axis =
df.sort_values(by=['金額','時間'],ascending = [True,False,]) 金額は昇順に 時間は降順になる .tail(x) .head(x) テイルは末尾x ヘッドは頭からx それぞれ数値を入力してその数だけ確認できる
df = pd.read_excel('Excelパス',sheet_name = 'シート名') ##シートを指定して読み込める df.sort_values(by = 'カラム名') ##sort_valuesとカラム名で大きい順に並び替え 昇順 df.sort_values(by ='カラム名', ascending = False) ##Falseで降順 Trueで昇順に
df[df['都道府県名'].str.endswith('山')] str.endswithとは特定の文字列で終わるデータを抽出するもの 例 富山 df[df['西暦(年)'] == df['西暦(年)'].max()] maxは指定した列の最大値に当てはまるデータを抽出する この場合'西暦(年)'の最大値に等しい行がデータフレームとして抽出する
df[df['都道府県名'].str.contains('川')] str.containsとは特定の文字列を含む要素を持つ行のデータを抽出するもの 例 神奈川 石川 香川 df[df['都道府県名'].str.startswith('山')] str.startswithとは特定の文字列から始まるデータを抽出するもの 例 山形 山梨 山口
df = df.rename(columns={'西暦(年)': 'year'}) df.query('year == 2015 and 都道府県名 == "東京都"') データフレームのカラム名を 西暦(年)→ year queryを使って year == 2015 → yearが2015 かつ and 都道府県名 == "東京都"→ 都道府県名が東京のデータ これらを指す
ライブラリとは便利な機能 pandasは Pythonでデータ解析やデータ操作、型変換などを行うためのライブラリ 様々な形式のデータを操作するための機能が提供されており、データの読み込みや異なるデータ形式への変換などができる matplotlibは Pythonのグラフ描画ライブラリ 棒グラフや折れ線グラフ、散布図など様々な種類のグラフを描画する機能が提供されている 折れ線グラフを描くには matplotlib.pyplot のplot関数を使う plot関数の第1引数
1課題 ゴール 仮説の設定 2データ収集 3データの確認と理解 4データクリーニングと前処理 5データの分析 1達成すべきゴール データありきではなく目的があってから必要なデータが集められる 明確なゴールが必要 2課題に必要なデータを集める 3よく確認しデータに馴染むことで分析できるようになる 4不正確や欠損などそれらをきれいにクリーニングする 5 1から4を通して分析手法に適合するようにデータを変形させる 1番時間がかかるのが5 習得するのに時間がかかるのもデー
import pandas as pd df = pd.read_csv('パス',encoding = 'shift-jis') df[df['西暦(年)'] == 2015] →データフレーム内の西暦の中の2015に一致するデータ df[df['西暦(年)'] % 10 == 0 ] →西暦を10で割り切れるもの 2000 2010 2020 …etc df[~(df['西暦(年)'] % 10 == 0)] →西暦を10で割り切れないもの 1993 2013 20