開発コラム:Amazon Macieで機密情報を検出・保護しよう!
気づけば開発コラムも3回目となりました!
まだ読んだことない…という方は、マガジンにまとめてますのでチェックしてくださいね!
医療DXの開発を担当している、クラウドサービス推進部の山田です!
今回はAmazon Macieで機密情報を自動的に検出する方法ついてご紹介します。
医療DXのサービスに関してはこちらをご覧ください↓
この記事は、2022年9月時点の情報にて作成しております。
はじめに
近年、企業規模を問わず、個人情報等の機密情報漏えいに関するニュースを良く耳にしませんか?
他社の漏えい事例を知って「何か対策しないと…」
とお考えになったことはありませんか?
令和3年度における個人情報保護委員会の年次報告※によると、個人データの漏えい等事案の報告件数はなんと5,846件!
令和2年度の4,141件から約1,700件増加しています。漏えいの原因はサイバー攻撃や設定ミスなどさまざまです。企業・組織で取り扱うデータが増大するにつれて、機密情報の適切な管理が難しくなっていると考えます。
そこで今回はAmazon Macieを利用して機密情報を自動的に検出する方法をご紹介します。Amazon Macieには他にもAmazon S3の使用状況の可視化や検出結果を他のサービスに連携する機能などがありますが、本稿では取り扱いません。
※年次報告は、個人情報保護委員会が個人情報保護法第163条の規定に基づき、委員会の所掌事務の処理状況について毎年国会に報告するもの
Amazon Macieとは
Amazon Macieは、機械学習を使用してAmazon S3上にある機密情報を自動的に検出するサービスです。例えば以下のような識別子を検出できます。
氏名
生年月日
メールアドレス
クレジットカード番号、有効期限
電話番号
AWSシークレットキー
識別子にはAWSが提供するマネージド識別子とユーザーが定義するカスタムデータ識別子があり、上記はマネージド識別子に含まれています。カスタムデータ識別子は正規表現を使用することができるため、柔軟な検出が可能です。AWSマネージド識別子には日本語のキーワードが含まれていない(Credit Cardというキーワードは検出するが”クレジットカード”というキーワードは検出しない)ため、日本語のキーワードを指定したい場合はカスタムデータ識別子を設定する必要があります。
今回は日本語のキーワードから検出できるように3つのカスタムデータ識別子を設定します。
名前
クレジットカード番号(VISA)
携帯電話番号
※名前は”佐藤”、”鈴木”、”高橋”の文字列にマッチする正規表現
※VISAのクレジットカード番号は先頭が”4”で始まる16桁
機密情報を検出してみます
下記のデータをMicrosoft Excel ワークブックで作成し、Amazon S3上にアップします。
Amazon Macieを有効化します。
カスタムデータ識別子の作成
クレジットカード番号(VISA)検出用
クレジットカード番号(VISA)に一致するパターンを定義する正規表現を設定します。画面右の評価にて、正規表現のテストをすることができます。
名前と携帯電話番号検出用のカスタムデータ識別子も同様に作成します。
ジョブ作成からデータ保管用Amazon S3バケットを選択します。
ワンタイムジョブを選択します。
マネージドデータ識別子はなしを選択。(カスタムデータ識別子を使うため)
作成したカスタムデータ識別子を選択。
任意のジョブ名を入力し、ジョブを作成。
ジョブ実行中
しばらくするとステータスが完了になります。(15分程度かかりました)
検出結果はこちらです。
想定通りに検出できました!
今回はAWSマネジメントコンソールから設定しましたが、APIやAWS CLIからも利用できるため、システムに組み込むことも可能です。
おわりに
今回はAmazon Macieで機密情報を自動的に検出する方法ついてご紹介しました。
●気づかないうちにAmazon S3上に機密情報が存在しているかも
●機密情報が正しく管理・保護されているか自信がない
という方、この機にAmazon Macieを利用してみてはいかがでしょうか。
ー参考ー
個人情報保護委員会 年次報告・上半期報告
https://www.ppc.go.jp/aboutus/report/
What is Amazon Macie?https://docs.aws.amazon.com/macie/latest/user/what-is-macie.html
キヤノンITソリューションズでは高い技術力を元にDXにお役にたてるソリューションを多数ご用意しております。
お困りのことがありましたら、お気軽にご相談ください。
※本記事に記載されている会社名、製品名は、それぞれの会社の商標または登録商標です。
★―☆。.:*:・゜――――――――――――――――――――――――
キヤノンITソリューションズ 公式Webサイト
医療DX関連ページ