見出し画像

ググったときの理解度が上がるPython用語

こんにちは、コグラフ株式会社データアナリティクス事業部の平松です。
今回はPythonの用語について解説します。

Pythonの用語って難しいですよね。
ググってもよく分からなかったという方は多いと思います。
そんな方に向けて書きましたので、これからPythonを学び始めようという方、初心者の方は是非、御一読ください!


Python用語理解の重要性

Pythonの用語や構造は一見複雑に見えます。
専門用語が多く、ライブラリの中にパッケージ、モジュールがあったり、リストの中にリストがあったりとマトリョーシカなのかと疑うほど階層化されており、取っつきにくいと感じる方もいると思います。

しかし、なぜそういう構造になっているのか、何の意味があるのか理解できると便利なものに見えてきます。そのファーストステップが用語の理解といえるでしょう。

モジュールとは

モジュールは、関数やクラスをまとめたもので、拡張子が「.py」のPythonファイルのことです。
普段、みなさんが作成しているPythonファイルもモジュールとして読み込むことができます。
ファイル内にはPythonで書かれたコードが記載されており、
モジュール < パッケージ < ライブラリという規模なので、3つの中で最小単位のものといえます。
とにかく、皆さんが普段作成している「ファイル名.py」がモジュールです。

パッケージとは

パッケージは、複数のモジュールをまとめたフォルダのようなものです。
皆さんも普段、複数ファイルを整理するため、エクスプローラーでフォルダを作成し、その中にファイルを入れていくと思います。
パッケージも同じようなもので、少し異なるのが「__init__.py」というモジュールが含まれているとき、コンピュータがパッケージとして認識することです。
パッケージの中にある「__init__.py」(initモジュール)はパッケージを初期化するためのモジュールです。
通常パッケージを作成するときはinitモジュールを作成します
また、パッケージを読み込む際、initモジュールが最初に読み込まれます
initモジュールの中にコードを書かなくてもパッケージとして認識されます。

Pythonにおけるライブラリとは

クラスや関数、モジュール、パッケージなど、他のプログラムから呼び出されるものの総称です。
モジュールやパッケージは全てライブラリです。
その外にも標準ライブラリ、外部ライブラリがあります。

標準ライブラリ

Pythonをインストールしたときに一緒にインストールされるパッケージ、モジュール、関数などのことです。

外部ライブラリ

別名、サードパーティライブラリといいます。
Pythonをインストールしたとき、一緒にインストールされないパッケージ、モジュール、関数のこと。
インストールして、import文を書くことで使用可能になります。
メジャーなライブラリである、pandasやnumpyは外部ライブラリです。

import pandas as pd
import numpy as np

このように、「import ライブラリ名」でインストールした外部ライブラリを利用可能な状態にすることができます。
自分で作成したモジュールも同じように別のモジュールにimportすることで使用可能にできます。

変数とは

pythonでいう変数とは、値に名前を付ける仕組みであり、名前はその値を指し示すことになります。
また、値が1つに決まっておらず変化するデータの箱とも言えます。
変数自体に型はなく、変数から示される型は、変数の中に格納されているものの型になります。
変数に値を代入した時に変数が定義されます。
例えば、

/* 変数a,bに、数値の5,2を代入*/

a = 5
b = 2
print(a + b)

/*7が出力される*/

上記のコードですが「a」、「b」はそれぞれ5、2が代入された変数です。
何度も再定義することが可能で最新の変数定義(最後に書かれた変数定義)が適応されます。

関数とは

値を渡すと、その値に応じた何らかの値を返すものです。
また、関数に渡す値のことを引数といいます。
これだけではピンとこないと思うので、詳しくコードで見ていきましょう。

a = [1,2,3,4,5]
print(sum(a))
 
/*15が出力される*/

aには[1,2,3,4,5]の数値が入っています。
sum(a)は、sum()という関数でaを処理するというコードです。
sum()とは「合計する」処理を行うので、15という出力結果が得られます。
上述した説明にコードの例を当てはめると、
sum()という関数に、a([1,2,3,4,5]が入った箱)という変数を渡すと15(その値に応じた値)を返します。

メソッドとは

メソッドは型に属した関数で、クラスで作ったオブジェクトをインスタンス化して呼び出すものと説明されますが、クラスを学んでいない初段階でこの説明を聞いても理解できません。
なので、使い方で区別することにします。
100%正しい説明というわけではないのですが、初心者でもわかりやすいように、簡素化して説明します。

関数:単独で呼び出しできるもの
メソッド:変数や値に付けて呼び出すもの

例えば、len()やprint()は単独で使えるので関数です。
対して、join()やappend()は前に変数が必要なのでメソッドになります。
「でもsumはどちらも使えるからどっちになるの!!」と思われている方、最高です!ではコードで見ていきましょう。

a = pd.Series([1,2,3,4,5])

print(sum(a))     /*関数*/
print(a.sum())    /*メソッド(厳密にはSeriesオブジェクトのsum関数)*/

上記の通り、前に変数や値を必要とする場合、それはメソッドになります。
pd.concatも同様です。対して、sum(a)は前に変数や値を必要とせず、関数単独使用できるので関数になります。同じ関数でも使い方で呼び名が変わるのでややこしいですよね。

データ分析に興味がある方大歓迎!

コグラフ株式会社データアナリティクス事業部ではPythonやSQLの研修を行った後、実務に着手します。
研修内容の充実はもちろん、経験者に相談できる環境が備わっています。
このようにコグラフの研修には、実務を想定し着実にスキルアップを目指す環境があります。
興味がある方は、下記リンクよりお問い合わせください。

Twitterもやってます!

コグラフデータ事業部ではTwitterでも情報を発信しています。
データ分析に興味がある、データアナリストになりたい人など、ぜひフォローお願いします!

いいなと思ったら応援しよう!