【dbts2024 レポート】「2024年時系列データベースの最新動向と最適な選択基準」
db tech showcase 2024 1日目のA9セッションである「2024年時系列データベースの最新動向と最適な選択基準」のレポートをお届けします。
セッション概要
はじめに
昨今需要と注目の高まる時系列データと時系列データベースについて紹介。
最新の市場動向に基づきながら、時系列データベースを選択するための基準の解説、主要な選択肢の比較検討、時系列データベース選定のための実践的なガイドラインの提示を行う。
時系列データ/データベースとは
時系列データ固有の特徴として「時間の順序がある」「自己相関がある」「季節性がある」ことが挙げられる。これらの特徴によって、時系列データの取り扱いにおいては既存のRDSではなく時系列データベースを採用することで、ビジネスにおける価値の最大化に寄与できる。
時系列データベースの一例として、QuestDB、 GridDB、 infuxdb等が挙げられる。
時系列データの選択基準
時系列データベースを選択するための選択基準としては以下:
データのスケーラビリティとパフォーマンス
DB自体のボトルネックはシステム全体のボトルネックにつながる。
特に、時系列データは大量のデータポイントを生成するためDBそのもののスケーラビリティが重要。
データ圧縮とストレージ効率
ストレージ効率が高く、コスト効果のあるソリューションであることが必要。
時系列データベースにおいて、キーはおよその場合タイムスタンプであり、タイムスタンプに特化した圧縮形式を採用していることや、冗長化を検討する際も効率的であるかどうか等が選定基準となる。
目先だけではなく、1年後、5年後を見据え、扱いきれるかどうかが重要なポイント。
クエリ機能
高いクエリ機能を提供しているか、実際の製造工程においてDBがボトルネックにならないかに注意。
また、時系列データ特有のクエリが効率的に実行できることも見るべきポイント(範囲検索、グルーピング、集計など)
インテグレーションとエコシステム
既存のインフラやツールとどの程度統合できるかも考慮する必要がある。
データベースはそれ単体で使われることはなく、サブシステム等と組み合わせて利用することが一般的。
エコシステムがどの程度充実しているかも重要。クライアントライブラリやツール、サードパーティ製品等含め、どれだけ技術情報が提示されているかも選定の際に参照するべき。
耐障害性とリカバリ
DBが停止したとしてもダウンタイムが可能な限り短いことが求められる。
耐障害性を有していても事故自体は起こってしまう。よって、データのバックアップとリストアが容易であることが望ましい。
運用と管理の容易さ
製造だけではなく整合後のことも鑑み、運用が簡単であり管理負担が少ないかどうかも選定基準として重要。
コスト
初期投資や運用コストが適正か。ビジネスにおけるイニシャルとランニングコストは重点的に見られるポイント。OSSと商用ソリューションとの比較等によって最適な選択を行う。
まとめ
IoTデバイスの増加等に伴って時系列データそのものや取り扱う機会は近年顕著に増大している。
既存のRDSではなく、時系列データの取り扱いに適した時系列データベースを利用することで、ビジネスに対する価値を最大化できる。
時系列データベースの実事例として、金融市場、IoTセンタデータ、気象、医療データなど、現在ではすでに多岐にわたって利用されている。
今後の展望としては、エッジコンピューティングとの統合、AIおよび機械学習との連携が挙げられる。
聴講した感想
時系列データそのものの特徴を改めて定義した点が興味深かった。
既存のRDSに則ったまま手なりでビジネスを推進するのではなく、その特徴に沿ったソリューションを採用することで、よりビジネスの付加価値を最大化できる、としており、需要の高まる時系列データへの取り組みを紹介いただいたことは大変勉強になった。
アーカイブ動画配信のご案内
db tech showcase 2024は、期間限定でアーカイブ動画を配信中です。
本イベントのセッションをオンラインでご視聴いただけるほか、講演資料のダウンロードも可能です。継続公開が決まったdb tech showcase 2023のセッション動画も含め、約130本の動画を自由に見ていただけます。
※一部対象外セッションあり