![見出し画像](https://assets.st-note.com/production/uploads/images/159187749/rectangle_large_type_2_450f51b93aec37e52ca5149723f5f117.png?width=1200)
時系列データの可視化とは?(Ver.3.9.5)
こんにちは。時系列データ分析ツール Node-AI のスクラムマスター 中野です!
今回のバージョン 3.9.5 では、可視化のチュートリアルをアップデートしています。
![](https://assets.st-note.com/img/1729210498-LTd7JyAMVhvHK8mgslrIbPQi.png?width=1200)
新規登録者の方は、チュートリアルプロジェクト内の「Level 1: データ可視化チュートリアル」を選択してください。
※登録済みの方は、新規キャンバス作成時にテンプレートとして「データ可視化チュートリアル」を選択してください。ただし画面右側の「テキストガイド」は表示されず、データも配置されていない状態となります。
![](https://assets.st-note.com/img/1729210599-L8x7PXhazfdy0OsZRCqKrmQ9.png?width=1200)
今回はせっかくなので、あらためてデータの可視化について語らせていただきます。
「データサイエンス」「AI」といったワードを聞くと、ついスマートで最先端な技術を想像してしまいがちです。
もちろん、近年のディープラーニングや生成AIの爆発的な進歩が様々な恩恵をもたらしていることは確かですが、昔から言われている "Garbage in, garbage out" (ゴミを入れたら、ゴミが出てくる)という基本的な考え方は変わっていません。
世の中の大半のデータはゴミの状態です。
つまりそのままAIだとか機械学習だとかをしようとするとゴミが作られます。
これは多くのデータサイエンティストが感じていることだと思いますが、特にビジネスサイドで初めてAIの導入をしようとしている方や、(私も最初はそうだったように)学習サイトなどで「きれいな」データしか扱ったことがない分析初学者には想像が難しいかもしれません。
「データあるからAI作れますか?」「このAIは精度がいいですか?」「どれくらいの期間でAIができますか?」
データサイエンティストをしていると、このような質問をよくいただきます。
適切な課題設定ができているという大前提はありつつ、この類の質問には「データを見ないとなんとも言えません」と回答します。
(逆に、「できますよ!」と即答するデータサイエンティストがいたとしたら疑ったほうがよいでしょう。)
データサイエンティストの言う「データを見る」には様々な意味が含まれます。単にエクセルファイルを開いて目視で内容を確認するだけではありません。
データがゴミ化するには多くのパターンがあります。
例えば時系列データであれば、意味不明な欠損値や文字列が入っているとか、データの途中で値の意味や時間間隔が変わっていたりといったことです(一例です)。
厄介なのは「明らかなゴミ」だけでなく「よく見るとゴミ」な場合でも、AIモデルの精度に致命的な影響をもたらす可能性があることです。
よって、ゴミは慎重に取り除く必要があります。
慎重にと言っても、データを1行ずつ眺めていては日が暮れてしまいます。そこで登場するのが様々な「可視化」の手法です。
「よく見るとゴミ」なデータはいろいろなところに潜んでいます。
また「ゴミ」と言うとノイズデータのようなものだけを想像してしまいますが、「人間の直感に反するような傾向」も注意すべきゴミの一種です。
そのため、1つの可視化結果からではゴミは判別できないことがあります。可視化の手法が多岐にわたっているのは、様々な角度からデータの細部を目立たせ、人間が理解しやすくするためです。
よって、データの可視化には試行錯誤が必要で、労力がかかります。
また不確実性が非常に高い作業なため、どれくらい可視化の作業を頑張る必要があるかの判断は非常に難しいです。
こういった悩みが「データを見ないとなんとも言えません」の一言の裏側にあるということです。データを可視化することの意義はおわかりいただけたでしょうか?
Node-AIでは各種可視化の手法をノーコードで試すことができます!
例えば以下の記事を参考にしてみてください。
今回は以上!