インフラエンジニアが業務上気をつけなければいけないこと
こんにちは。さっとんです。
インフラエンジニアが業務上気をつけなければいけないことについて話していきたいと思います。
インフラエンジニア初学者や未経験の方に見ていただければと思います。
この記事を読むと業務で何に気をつければいいのかわかると思います。
1.誤操作
インフラエンジニアは誤操作が命取りになります。
そのため、既存マシンを作業する際には慎重な操作が必要となります。
電源を落としてはいけない機器に対し、誤ってシャットダウンボタンをクリックするとします。
その場合、サービスによっては数万規模と大きな影響が出ることがあります。
僕自身も誤操作で大きなミスをしたことがあります。
昨日の記事にこの誤操作について投稿しているので、是非ご覧になってみてください。
2.作業ログ取得
インフラエンジニアでログを取得することは非常に大事です。
おそらく、ログ取得推奨ではない現場自体少ないと思います。
作業ログを取得する理由
・システムでミスを追求されたときに証拠として示すことができる
・あとで作業方法を見返すことができる
・ナレッジ作成や作業手順書作成に使用することができる
実際に構築現場ではこのように作業ログを取得しております。
※使用PCがWindowsマシンの例のみとなります。
◯GUI画面(Windows系/仮想化基盤等)
「WinShot」や「SnappingTool」等を使用して画面キャプチャを取得します。
特に「WinShot」はボタン一つで画面キャプチャを取得するよう設定ができるためおすすめです。
保存先もツール内で設定可能です。
詳しくは下記ページをご覧下さい。
◯CUI画面(Linux系/仮想化基盤系等)
CUI画面へアクセスするために、「TeraTerm」や「PuTTY」というツールを使用します。
基本的にこちらのツールのログ取得機能でログを取得します。
僕自身「TeraTerm」を使用することが多いです。
よろしければ下記の「TeraTerm」についてのリンクも確認してみて下さい。
3.情報共有
情報共有は業務上肝だと思います。
情報共有を怠った場合ミスを誘発する可能性があります。
例をあげると、
・構築途中の案件を引き継ぎ忘れるとき(設定内容等)
・連絡しなければいけないものを引継ぎ忘れたとき(アラート等)
などなど
今回は引継ぎを例に上げました。
情報共有を怠った場合は下記のようなことが起こり得ます。
・マシンの設定漏れ/手戻り
・アラートの連絡忘れ/大規模な障害につながる
このように情報共有を怠ると恐ろしいことが待ち受けております。
些細なことでも情報共有をするようにしましょう。
まとめ
・誤操作は大規模な障害につながる。作業は慎重に実施
・ログ取得は自分を守るために必要
・情報共有はミスを回避するために必要
ここまで読んで頂き有難うございます。
Twitterとブログもやっておりますので、こちらも確認してみて下さい。