クラウドに置けない重要データ、「自動階層」で使いやすく
データが爆発的に増えるのに伴い、それを格納するストレージをどうするか。よく使われるクラウドストレージは場合によって思わぬコストが発生して割高になることがありますし、そもそも社内外の規定やセキュリティの関係で、データをそもそも社外に保存できない企業もあるでしょう。オンプレミスで大量データを高速かつ安価で安心・安全に使うソリューションとして、今「ストレージの自動階層」が注目を集めています。
「捨てられない」データで埋め尽くされるストレージ
普段ほとんど使われていないデータでも、将来的には画期的な活用方法が見つかって宝の山となる可能性があります。また、監査などで後から確認が必要となることもあります。そのため、データをなかなか捨てられないのが一般的です。
それがストレージの圧迫につながります。データ管理とコストの視点から言えば、頻繁にアクセスする「ホットデータ」は多少コストが高くても高速のSSDなどのフラッシュストレージに、アクセス頻度は低いが保存しておかなければならない「コールドデータ」は速度に劣るが低コストのハードディスク(HDD)といったように、用途に合わせたストレージに格納して階層管理するのが望ましいところです。
ところが実際は、これら2種類のデータを区別せずに管理する企業がまだまだ多いのが現状です。求める要件が相反するホットデータとコールドデータを1つのストレージで満たそうとすると、必要以上のコストがかかってしまうことがあります。
「オンプレミスが適したデータ」の管理が問題
大量データを保存するためによく使われるクラウドも安いとは限りません。例えば、データ転送量に応じた従量課金になっている場合、クラウドからオンプレミス、クラウドからクラウドといったようにデータを移動させるだけでコストが発生してしまいます。
さらに「機密情報のためクラウドに格納できない」「サイズが大きいのでクラウドでは遅延が発生して業務に支障が出る」「そもそも規約で社外へデータを出すことができない」といった理由で、どうしてもオンプレミスのストレージにデータを置かざるを得ない企業は少なくありません。
典型的なのが医療や製造業です。医療のデータは個人情報などセンシティブな内容が多く、エックス線画像などの画像データもサイズが大きくなります。診察の待ち時間を増やさないために素早く表示できる必要もあります。そのため、ストレージはオンプレミスでオールフラッシュストレージを利用する構成が一般的です。製造業で設計に使っている3Dデータもクラウドに出さず同様のストレージ構成にすることが当たり前です。
ただし、オールフラッシュストレージはコストが高く、全てのデータを格納するには向いていません。できれば利用頻度が高いデータだけをオールフラッシュストレージに格納し、利用頻度が低いデータはコストの安いHDDやクラウドストレージなどに格納したいところです。
「オンプレミスで自動階層」のメリットとは
利用頻度に応じてデータを分けて階層管理すべきですが、既に蓄積している大量のデータについて「どのデータの利用頻度が高く、どれが低いのか」を人間が分けるのは大変な労力が必要で現実的ではありません。この問題を自動化によって解決するのがネットアップのストレージOS「ONTAP」が提供する「FabricPool」です。
FabricPoolは、データの利用頻度に合わせてコールドデータであればレスポンスは遅いが安価なクラウドストレージに、ホットデータであればレスポンスの速いフラッシュストレージに格納するといった使い方を、ユーザーの手間なしで自動的に処理します。コールドデータにアクセスした時点でFabricPoolがそれをホットデータと判断し、ホットデータのストレージに移動。そのため、コールドデータでもレスポンスが高速です。利用者はホットデータかコールドデータかを意識せずに利用できます。
ただ、FabricPoolはオンプレミスのオールフラッシュストレージに加え、「Amazon S3」(Amazon Simple Storage Service)などのクラウドストレージを利用するのが前提でした。そこで、2020年に登場したのがネットアップの拡張機能「ONTAP S3」です。オンプレミスで動作するオブジェクトストレージをAmazon S3の代わりに利用できます。つまり、ONTAP S3とFabricPoolを組み合わせれば、クラウドを使わずオンプレミスのストレージだけでデータの自動階層管理が可能になるのです。
十分実用的な「自動階層管理」の実力
データを自動階層してオンプレミスで管理できれば、ストレージの容量とデータの管理に関する課題も解決できますが、気になるのがレスポンスでしょう。データを自動で区別してくれても、レスポンスが遅ければ業務に使えません。
そこで、1997年からネットアップのストレージ製品を扱う丸紅情報システムズは、ONTAP S3とFabricPoolを使った自動階層管理のレスポンスを検証しました。丸紅情報システムズが導入したネットアップのストレージはシリアル数でこれまで5000を超えており、数多くの導入事例やノウハウを持っています。「ネットアップ製品の構築を専任で行っているチームがあり、検証もそのチームメンバーが実施しています。ネットアップに対する豊富な知識とノウハウには絶対の自信があります」と、同社IT基盤ソリューション事業本部事業推進部スペシャリストの本杉氏は語ります。
レスポンスの検証ですが、具体的には960GバイトのSSDを12本使ったRAID-DP(Double Parity)構成のホットデータ用ストレージと4Tバイト(テラバイト)のHDD(ニアラインSASディスク)を使ったコールドデータ用ストレージを10GbE(ギガビットイーサネット)で接続して性能や運用手順について検証と障害試験などを実施しました。
その結果、通常ストレージと比べて「著しい応答遅延」はないことが分かりました。「自動階層の処理をしても動作にほとんど影響がなく、ファイルアクセスも問題なくできました。コールドデータ用のストレージから読み出す場合もレスポンスタイムは20ミリ秒以下で、ファイルサーバーとして利用しても業務に支障がないレベルです」(本杉氏)。
丸紅情報システムズは「膨大なデータをオンプレミスで管理したい」というニーズに対し、ONTAP S3とFabricPoolの組み合わせを積極的に提案するとしています。同社IT基盤ソリューション事業本部事業推進部スペシャリストの浦川隆弘氏はこう語ります。「オンプレミスでの自動階層はもちろん、クラウドの活用を含め顧客ニーズをしっかりとヒアリングし、最適な提案をします。今後も新しい機能の検証を率先して実施し、実体験を基にした“リアリティーのある提案”をして顧客の期待に応えます」
オンプレミスに置いておきたい重要データ。ストレージのコストを抑えながら、もっと使いやすくするのが自動階層化です。あなたの会社でも検討してみてはいかがでしょうか。