データサイエンティストの頭の中 vol.9~データ分析の可視化はseabornでOK~
今回はデータ分析の中で、データの基礎分析があります。データを集計して可視化するということですね。これに関しては初学者はもちろんデータサイエンティストでも重要なスキルになります。
予測モデルをつくるときもそうですし、分析業務でも使います。その中で「可視化」の領域に着目しました。可視化の際に使うのが、matplotlibとかseabornとかがあります。初学者はどちらにするか結構迷うところだと思いますので、その観点でインタビューしました。
より詳しくは動画で語っておりますのでチェックしてみてください!!
1 matplotlibとseabornについて
可視化のときに使うmatplotlibとseabornについてですが、matplotlibは昔からあって可視化では超基本的なやつ。seabornはそのmatplotlibのグラフを作る部分をより簡単にしたもの、みたいなイメージでOKだそう!
初学者の方にとっては丁寧に可視化するとかは最初必要ないので、データを可視化するときのグラフさえ見れれば良いのでseabornで充分だそう。。
細かい話をすると、グラフを出すのはseabornでOKなのだが、実際の業務では、そのグラフの内容だとかタイトルとかもつけるので、そうするとmatplotlibを使うらしい。Yujiはグラフはseabornで書いて、他はmatplotlibで表示させる可視化のやり方をメインで行なっているとのこと。
知り合いのデータサイエンティストは基本的に上記の使い方でやってました!
さらに細かい話をするとseabornでしか表せないグラフとかmatplotlibでしかできないこともそれぞれあるらしいのですが、上級者しかわからなくて良いのでまずは「seabornで可視化をしよう」とのこと。
2 seabornを使うメリット
じゃあなんでそんなseabornなのか、というと「とにかく簡単だから」だそう。グラフを一行のコードで書くことができる。matplotlibの場合数行かかないといけないこともあるので初学者にとってはややこしい。
だからこそシンプルで簡単なseabornで出す方がメリットがある!とのこと。
そもそもデータをグラフで可視化するだけ、しかも自分が見れれば良いという状況ならseaborn一択でOK。初学者でmatplotlibに慣れてない場合そこで詰まる方がもったいないのでとりあえずはseabornでいきましょう。
その後慣れてきたらmatplotlibやseabornを使い分けていくイメージが良いです!
また細かい話をするとseabornの方が新しいためより綺麗なグラフが書けるので見やすさもseabornの方があります!
初学者の方はデータの基礎分析で可視化の部分はseabornでやっていきましょう!という内容でした。
今回は以上になりますー
■■■「データサイエンティスト」と「データサイエンティストになりたい人」、「データサイエンスを勉強したい人」のためのオンラインサロン
を開設しました!!■■■
この記事が気に入ったらサポートをしてみませんか?