vCloud Director 9.7で詰みかけた話
vCloud Director 9.7(Appliance版)をデプロイしたところ上記のエラーがでた。「No nodes found in cluster, this likely means PostgreSQL is not running on this node. Consult the management UI from another node where PostgreSQL is running. Otherwise, check /opt/vmware/var/log/vcd/vcd_ova_ui_app.log if you think this is an error.」
直訳「クラスター内にノードが見つかりません。これは、PostgreSQLがこのノードで実行されていないことを意味している可能性があります。 PostgreSQLが実行されている別のノードから管理UIを参照してください。それ以外の場合は、/opt/vmware/var/log/vcd/vcd_ova_ui_app.logをチェックして、これがエラーであると考えます。」
なぜかPostgreSQLが失敗している。
Primary Nodeのみデプロイしたため、他ノードでPostgreSQLが実行されているとかいう話はありえず、指示通り /opt/vmware/var/log/vcd/vcd_ova_ui_app.logを見てみる。
2020-06-11 08:29:33,962 | ERROR | uWSGIWorker1Core0 |
ERROR: Command 'cd /opt/vmware/vcloud-director && sudo -n -u postgres
/opt/vmware/vpostgres/current/bin/repmgr cluster show' returned non-zero exit status 1.
2020-06-11 08:29:33,963 | ERROR | uWSGIWorker1Core0 | Return code: 1
2020-06-11 08:29:33,963 | DEBUG | uWSGIWorker1Core0 | Parsed Cluster Status: {}
2020-06-11 08:29:33,964 | DEBUG | uWSGIWorker1Core0 | Got cluster status: {}
全然わからん。
ググったら、以下のVMware Comunityの投稿があった。
https://communities.vmware.com/thread/610111
これをみるとNFSの設定がうまくいってないと上記のエラーがでるらしい。
ちゃんと書き込みできてるんだよねー。。。
上の投稿で回答者が以下のログを見てたので、僕も見てみる。
/opt/vmware/var/log/vcd/setupvcd.log
2020-06-11 08:23:08 | Mounting NFS file share...
2020-06-11 08:23:09 | System ip0 is: xx.xx.xx.xx
ls: cannot access '/opt/vmware/vcloud-director/data/transfer/appliance-nodes': No such file or directory
ls: cannot access '/opt/vmware/vcloud-director/data/transfer/cells': No such file or directory
2020-06-11 08:23:09 | Invoking appliance-sync.sh now...
2020-06-11 08:23:29 | Configuring vCD from OVF properties as initial cell...
2020-06-11 08:23:29 | Configuring the embedded PostgreSQL database...
2020-06-11 08:23:29 | Creating PostgreSQL user (vcloud) and database (vcloud)...
CREATE ROLE
ALTER ROLE
ALTER ROLE
CREATE DATABASE
2020-06-11 08:23:30 | DB Host value is xx.xx.xx.xx
......................................../
Database configuration complete.
2020-06-11 08:24:43 | Copying local responses.properties to NFS.
2020-06-11 08:24:43 | Invoking firstrunwizard.sh now...
2020-06-11 08:24:58 | [ERROR] Failed to run firstrunwizard.sh. See /opt/vmware/var/log/vcd/firstrunwizard.log for details. Aborting.
NFS領域(/opt/vmware/vcloud-director/data/transfer/appliance-nodes)にファイルがない・・・?そりゃPrimaryだもの。作ってよ。
で、なぜか他の部分読んでなかったんだけど(よくある)、上記エラーの最後、
2020-06-11 08:24:58 | [ERROR] Failed to run firstrunwizard.sh. See /opt/vmware/var/log/vcd/firstrunwizard.log for details. Aborting.
firstrunwizard.logを見ろと書いてある。
2020-06-11 08:24:44 | Running the system-setup CMT command ...
Unexpected error parsing command line options:
Missing argument for option: email
usage: system-setup
--email <arg> Required - Admin email
--full-name <arg> Required - Admin fullname
-h,--help Print this message
--installation-id <arg> Required - Installation ID. Range: [1..63]
--password <arg> Required (if unattended mode) - Admin
password
--serial-number <arg> Optional - License serial number
--system-name <arg> Required - System name
--unattended Optional - Unattended mode does not prompt
for the administrator password, which you
must supply on the command line.
--user <arg> Required - Admin username
2020-06-11 08:24:58 | [ERROR] system-setup failed possibly due to above error(s). Aborting.
・・・。
いやぁ長かった。
二週間くらいずっと戦ってたが、ようやくである。
Primary構築する際、Emailアドレス入れてなかったんだねー。
vCenter Serverが6.7U3なので、vAppオプションからメールアドレス入力して、デプロイ後のスナップショット入れて起動
ふぅ。よかった。
必須項目って書いといてよーとか思ったが、まぁ解決できただけよかった。
本ブログに行き着いた方がこの記事で解決に至ることを祈りつつこの記事を終わります。
では。