見出し画像

Nutanix LCMを使ったHCI環境のライフサイクル管理

はじめに

Nutanix LCMはご存じでしょうか?
オンプレミス環境にあるシステムを運用する上では嫌でも避けて通れないのがFirmwareやOSのバージョンアップで、関連してパッチ適用、ドライバ更新、ハードウェアのメンテナンスとしてのドライバの更新などなど、これらは誰もがやりたくない作業かと思います。1つのメーカーの1つの製品だけ使っていればいくばくか手間は軽減されるのかもしれませんけど、ハードウェアを部分に焦点を当てただけでも複数メーカーのハードウェアを使っているような場合は、それぞれの互換性が問題になることが多々あると思います。その上でOSや各種のソフトウェアが動作していると、それぞれが問題なく動作するバージョンを確かめて適用するというのは、非常につらい作業になることは間違いありません。
そんな手間な作業を少しでも楽にするためにHCI(Hyper Converged Infrastructure)製品は大体の製品でライフサイクル管理を楽にするための機能を備えており、それを利用することを推奨しています。サーバー、ストレージ、ネットワークといったいわゆるインフラレイヤーにおける三層構造(3Tier)のメンテナンスでつらい経験をした方からの声を踏まえて、HCIではそれを克服すべくライフサイクル管理機能が提供されているわけなので、HCI製品を利用するユーザーはこのライフサイクル管理機能を利用しない理由はないと思います。
今回はHCI製品であるNutanixのLCM機能を使って、どれだけ手間な作業が楽になるかを試してみました。メンテナンスにかかる時間も目安ではありますが、実測してみたのでその結果にも触れたいと思います。

実は私は、Nutanix LCMについては過去何度も使っていて、時々ブログにもその使用感をレポートしていました。

以前LCMについて記事を書いた時から数年経過していて、Nutanixのバージョンもかなり変わったのでかなり新しめのバージョンで改めて試してみた、というのが今回の記事の内容になります。
使い方の手順はあまり大きく変わらないので、細かな操作手順についてはあまり触れないでおこうかなと思いますが、大事そうなところは実際の画面も張りながらご紹介していこうと思います。

実際に試したこと

Nutanix LCMでは、ソフトウェア(AOSおよびAHV)とファームウェアの更新ができますが、これらをそれぞれ更新してみました。
使用した機材や環境についても簡単ですが触れておきます。

環境

Nutanix製品のOEM製品とはなりますが、Dell製のXC Coreというモデルを使っています。
ノード数は3ノード
HypervisorはAHVで、使用しているAOSのバージョンは6.5.6.5です。
今回はインターネットに接続できる環境で試しています。

LCMを使う上での必要な操作

Prism ElementまたはPrism CentralのLCMのメニューから操作することになりますが、LCMを使う上で押さえておくべき点は以下3つです。

インベントリの実行
 ソフトウェアバージョン、ファームウェアバージョンの確認
プリチェック
 
更新前の各種ステータスのチェック
更新
 
ソフトウェア、ファームウェアの更新処理

また、LCMによる更新作業においては、ソフトウェア(AOSおよびAHV)とハードウェア(Firmware)の更新は別々に実施する必要があります。全てまとめて更新することはできません。

手順

ソフトウェアのアップグレードを例に具体的な手順をご紹介します。

LCMはクラスタ名の右横にあるプルダウンメニューから選択します。

プルダウンメニューを開きます。
LCMを選択します。

LCMのメニューからInventoryを選択すると以下のような画面が表示されます。まずはインベントリを実行します。

[Performe Inventory]を押します。

完了するまでしばらく待ちます。この環境では6分ほど待ちました。

[Return to Inventory]を押します。

UpdatesのプルダウンメニューからSoftwareを表示します。

Updates - Softwareを押します。

今回アップデートするAOSとAHVを選びます。

AHV HypervisorとAOSにチェックを付けて[View Upgrade Plan]を押します。

少し待つと、アップグレードが可能なソフトウェアバージョンが表示されるので、問題なければ先に進みます。

[Next]を押します。

※補足
アップグレードしたいソフトウェアバージョンが表示されない場合、特に新しくリリースされたバージョンを使用したい場合は、そのバージョンのアップデートファイルをNutanix社のサイトからダウンロードして入手しておいてください。入手したファイルは以下のメニューのDirect Uploadsを押して、ファイルをアップロードしましょう。

ただし、使用しようとしたバージョンについてアップグレードパスがないと、アップグレードができませんので、現在使用しているバージョンからアップグレードが可能かは確認しておくこともお忘れなく。

アップグレード手順に戻りますが、AOSをアップグレードする前にこの環境で動作しているPrism Centralのバージョンを先にアップグレードしておく必要があると言ってきます。この環境ではPrism Centralをまだ展開していない段階であったため、ここは無視して先に進みます。

[Apply Updates]を押します。

ここから長い長いアップグレードタスクが行われていきます。長いといっても、クラスタ全体のアップグレードを数時間で終えられると思えば、かなり短いメンテナンス作業と言えるのではないでしょうか。クラスタ全体の停止が伴うわけではないですし、業務用の仮想マシンを動かしたままアップグレードができるので、何事もなければ仮想マシンを利用している方々はメンテが行われているとは全く気づくこともないでしょう。
なお、今回アップグレード前のプリチェックを明示的に行うことなく進めてしまったのですが、一連のアップグレード処理の中でプリチェックも走り、何か問題があれば進捗を示すバーが赤くなってタスクが止まります。
明示的にプリチェックをかける場合は、上の画面で示したAHVやAOSなどアップグレード対象を選択する箇所に[PreUpgrade]というのがあるので、こちらを実行してみてください。

しばらく放ったらかしにしておきましたが、約3時間10分ほどかかって無事にAOSとAHVのアップグレードが完了したようです。

[Return to Updates]を押します。

というような感じでLCMでアップグレードが可能です。操作手順を解説するほどでもないほど簡単にアップグレードが可能ですし、事前準備にしても自分でAHVやAOSの互換性を少し確認して、アップグレードしたいバージョンのバイナリを準備する程度なので、3Tier構成のように色々と手間暇をかけずに準備が済んでしまいます。

ハードウェアのアップグレードについても少しだけ触れておきますが、手順はほぼ同じやり方で進めることができます。
ハードウェア、つまりはFirmwareのアップグレードについては、使用しているハードウェア毎にメーカーの特色が出る部分かと思いますが、Dell製品の場合、XCというモデルになります。
以下のようにFirmwareとiSMと言われるソフトウェア(iDRACとOSが内部で通信するために使われるソフトウェア)の更新の対象となっています。

更新対象となるFirmwareやそのバージョンによっても更新に要する時間は変わってきますが、XCの場合、BIOS、iDRAC、NIC、iSMのバージョンアップで1台 約45分程度の時間で更新できました。
ソフトウェアのアップグレードと併せてハードウェアも、と考えて実施される方もいると思いますが、上でも触れた通り、LCMではソフトウェアとハードウェアを同時に更新することはできないので、同じタイミングで更新する場合には、更新する台数と両方の更新にかかる時間を考慮してメンテナンスの時間を考えるといいと思います。なかなか時間は予測がつきませんが、上で試した内容が多少は参考になる情報になるかなと思いますのでご活用ください。(あくまで参考値ですが)

おわりに

アップグレードはとにかく面倒だと思って全くやらないで済ませようという方も多いですが、これだけ簡単であればアップグレードは定期的に計画して実施すべきではないかと思います。HCI製品についてはソフトウェアバージョンのライフサイクルが非常に早く、これについていかなければサポートが受けられない事態も起きえます。LTS(Long Term Support)やSTS(Short Term Support)なんていう用語が色々な製品できかれるようになってきている昨今ですが、いくらサポート期間の長いLTSを選んでも5年、10年使い続けられるバージョンでもないですし、LTSを使う場合でも最低でも2年おきくらいにはアップグレードを実施いただくのがいいのではないかと思います。メンテをしないと予期しない不具合にあたる可能性もあるので、ソフトウェアのライフサイクルの観点だけでなく、定期的なメンテナンスとしてアップグレードされることをオススメしたいと思います。
以上、Nutanix LCMを使ったライフサイクル管理のお話でした。

いいなと思ったら応援しよう!