自分のデータに任意の列を追加したい時がある。 今回は、任意の列を足す練習。 デモデータpandasを使って表を作成する import pandas as pddf = pd.DataFrame({'A': ['100', '100', '90', '80'], 'B': ['53', '48', '46', '49'], 'C': ['0.1', '1.2', '0.8', '0.9']},
関数の呼び出し方について説明します。関数の定義の仕方と呼び出し方、関数における引数や戻り値はどれも関数の基本なので、必ず理解しておきましょう。 defを使いこなす①return(戻り値)の記事にて、関数の設定の仕方を学習しました。 では、作った関数はどのようにして呼び出すのでしょうか。いくつかの例題で考えてみましょう。 returnを省略した関数def add(a, b): print a + b shift+Enterをしても何も起きませんが、それで大丈夫です
画像の二値化は大切です。物体の検出や加工にも二値化は基礎となります。今回は基礎となる二値化をグラフを使って説明します。 必要なモジュールをインポート画像解析に必要なOpenCVとグラフ描写に必要なmatplotlib、%pylab inlineも入れておきましょう。 plt.gray()はグレースケール表示のためのメソッドです。 import cv2import matplotlib.pyplot as plt%pylab inlineplt.gray() 実行して、
Pythonでは画像処理も簡単にできます。 OpenCVというモジュールをインポートすると、画像処理が可能に。 変数の中に画像を格納することや、画像を簡単に二次元のnumpyアレイにしてくれ、非常に扱いやすくなります。 本日は、その基礎の基礎。 画像を読み込み、可視化しましょう。 目的の画像イラスト屋の画像を使わせてもらっています。この画像で、柄を二値化したいとします。 かわいいですね。 必要なモジュールをインポートさて、モジュールのインポート。私はJupite
numpy の2次元arrayの抽出をいろいろ試してみましょう。 まずは、1から始まり100までのデータを10×10に整形します。 ary1 = np.arange(1,101).reshape(10,10)print(ary1) 実行結果: [[ 1 2 3 4 5 6 7 8 9 10][ 11 12 13 14 15 16 17 18 19 20][ 21 22 23 24 25 26 27 2
pythonのコードが少しかけてくると、defを使って書いている人をよくみかけて、羨ましくなる。defの基礎を学びたい! def(関数)とは何だ?そもそも関数とは何だ?というお話。 中学の頃関数を習いましたが、その考えそのものです。 例えば、 y=3x という式があった場合、yの値はxの値によって変化します。この関係を『yはxの関数である』といいます。 で、高校になると数学は単純にyがf(x)に変わります。見た目は難しそうになりますが、内容は同じ。 f(x)=3
グラフを描く時は、自分のExcelやcsvで描く場合が多いと思います。 そして、個人的には1回しか作成しない図は、Excelで済ます方が早い気がします。何度も描く図であったり、大量のcsvがある場合は、pythonがよろしいかと。 コードでヒストグラム便利なseabeanなどもありますが、とにかくmatplotlibで描いてみましょう。.hist()で描けます。 import numpy as npimport pandas as pdimport matplotlib
箱ひげ図を描きます。 分かっている前提でのコードなので、箱ひげ図ときいて、ハテナの人はググってもらえますと助かります(ごめんなさいね)。 箱ひげ図を1つ描くax.boxplot()を使った基本的な方法です。 test = [100, 82, 65, 50, 63, 88, 98, 35, 78, 69] としたうえで、テストの成績を描いてみましょう。 %matplotlib inlineimport matplotlib.pyplot as plttest = [1
ここでは散布図を描いてみます。 散布図の基礎散布図は以下の描き方があります。 ・pltを使う(%matplotlib inline) 場合: plt.scatter() ・オブジェクト指向(コードで解決する)場合 : ax.scatter() 2種類で描くことができます。 筆者は前者で進めますが、念のため後者も記述します。 散布図を作成散布図を作成するには、 plt.scatter(x,y) #散布図を描く plt.show() #図を公開 を使用します。
pythonでグラフを描きたい時、Googleで『基礎』を知りたくて検索しても、まず『図の配置の仕方』から始まって、肝心のグラフの説明は後回しで、心が折れそうになります。 確かに基礎は基礎ですが、とにかく意中のグラフを描きたいのが初心者のホントのトコロ。 最低限のお作法を踏んだ上で、すぐにグラフにとりかかりませよう。 嫌になる前に、とにかくまず描いてしまいましょう。 matplotlibをインポートするmatplotlibを使う際は、matplotlibライブラリをイ
Excelやcsvのデータ処理をすると、『この条件で図を描きたい』と思う時があります。例えば、irisデータだと品目を区分けしてグラフを描く。みたいな。 それには、groupby()という関数が便利です。 ということで、さっそくirisデータの品目を区分けしてみましょう。 irisデータの取得はこちらの過去記事で。 groupbyを使ってみよう図を描くために必要なライブラリーをインポートしておきます。 import pansas as pdimport matplo
マージ (merge)とは、何かと何かをくっつける、統合するという意味です。単純にデータの統合というよりも、IDなどで紐づけられているデータがあった場合に便利な関数です。例えば、先に身長データが合った際、IDに紐づけることで体重データを足したり、1年後の体重の推移を足すことも可能。まぁ、やってみましょう。 基礎のマージ2つのdataframe、df1とdf2を作ります。 import pandas as pddf1 = pd.DataFrame({"d1" : range
PythonでPandasを使う人の多くは、自分のExcelやcsvデータに対し、何等かの処理をしたい場合が多い。 単発の処理だとExcel内でやってしまえばよいので、Pythonで仕立てるメリットは少ない。やはり、繰り返しができるからこそPythonでする意味、メリットが大きくなる。 ということで、今回はfor を使って、とにかく1回の処理ではなく、繰り返してみることにしましょう。 irisデータを使い、列名をforでみてみる ご存知、irisデータを入力します。d
リストとは、データ型の一つ。 代表的なデータ型は、リスト・タプル・辞書・集合の4つ。特に覚えなくて良いが、リストはよく使うので動かして覚えると良いと思います。 リストの作り方角かっこ[ ]で囲み整数、浮動小数点数、文字列などのデータを格納できます。リストには好きな種類のデータを好きなだけ格納できます。リストに格納できる個々のデータは『要素』といいます。 data = ['book','textbook','notebook'] リストをテキストで作成する場合は、’ ’
numpy に勤しみましたが、今度はPandasに挑戦しましょう。 PandasとはPythonのライブラリーの1つ。んん?と思った方、分かり易く説明しましょう。Pythonだけだと何も入れていないスマホのイメージです。そこにアプリを入れることで、LINEができたり、ゲームができたり、インスタなども可能になります。ライブラリーはそんな『アプリ』のようなイメージだと分かり易いと思います。 Pandasを使えば、データ分析が効率的に行えます。import pandas as
pythonを使っていると、任意のarrayを打ち込むよりも、持っているデータを解析したい場合が多々あると思います。 特に、csvデータの入出力はよくすると思います。 おなじみ、irisデータをPandasで読み込み、データにアクセスしましょう。 irisをPandasで抽出入力は、pd.read_csv()で簡単にできます。 ()の中に、csvが置いてある住所とcsvの名前をかけばOK。 import numpy as npimport pandas as pdd