
【無料版Gemini編③】無料デカ出動!生徒の成績を分析するのはどうなの?問題ーGoogleサイトで作るグループウェア(163)ー
🙇🏻いつも、Googleサイトで作るグループウェアを見ていただき、ありがとうございます!
この記事を読んで欲しい方
企業DXや校務DXの進め方に悩んでいる方
クラウドアプリの導入に悩んでいる方
自分だけのGoogleサイトを作ってみたい方
①Geminiを使った成績の分析って大丈夫?
今や、いろいろなAIが巷で繁殖していますが、利用するAIや種類によってユーザーデータの再利用の有無があります。
まずGeminiですが、
無料版Gemini:ユーザーの入力データを学習に利用します。
有料版Gemini for Google Workspace:ビジネス向けの有料プランでは、ユーザーデータは学習に利用されません。
Gemini API:Gemini APIを利用する場合、データは学習に使用されない可能性が高い。
ということで、普通なら無料版Geminiは成績の分析には使わないほうが良いんじゃないの?という結論になってしまいますが、本当にそうでしょうか?
ここは無料デカ(刑事)の出番です。

②個人情報でも暗号化すれば無料版Geminiで使えるのでは?
ITの世界では、個人情報のことをPII(Personally Identifiable Information)と呼びます。
「個人を識別することができる情報」で、マイナンバー番号、氏名、メール・アドレス、電話番号、住所など、その個人の身元を明らかにするための情報になります。つまり、どこまでがPIIなのかはきちんと決まっているのです。
これがAIの学習に利用されると個人情報漏洩になるのか?ですが、まずそんなことはありえないのですが、ゼロリスクじゃないとヤダ!という方たちが多いのも事実です。
そこで一計を案じて、投入データを利用者側で暗号化するアプリを作ってみました。
もちろん、鑑識のクロード君に作ってもらいます。

③シンプルCSV/TSV個人情報暗号化・復号化アプリ
はい、クロードくんは頭がいいので、サクッと作ってくれました。さすが玄人君(笑)
下のリンクをクリックすると起動します。

使い方は簡単です。CSVかTSV(エクセルからの直接コピペ)を入れて、暗号化キーを自動生成させ、暗号化ボタンを押すと、暗号化する列に指定されているフィールド名のところだけが暗号化されます。
暗号化されたデータは、結果のところに出てくるので、結果をクリップボードにコピーを押すと、クリップボードに入ります。
④実際にやってみる
いつもの成績データを使います。
日付 クラス 名前 科目 点数
2023/04/01 3年1組 Aさん 国語 77
2023/04/01 3年1組 Aさん 数学 80
2023/04/01 3年1組 Aさん 英語 90
2023/04/01 3年1組 Bさん 国語 46
2023/04/01 3年1組 Bさん 数学 51
2023/04/01 3年1組 Bさん 英語 74
2023/04/01 3年1組 Cさん 国語 77
2023/04/01 3年1組 Cさん 数学 86
2023/04/01 3年1組 Cさん 英語 65
2023/04/01 3年2組 Dさん 国語 1
2023/04/01 3年2組 Dさん 数学 93
2023/04/01 3年2組 Dさん 英語 14
2023/04/01 3年2組 Eさん 国語 71
2023/04/01 3年2組 Eさん 数学 36
2023/04/01 3年2組 Eさん 英語 68
2023/04/01 3年2組 Fさん 国語 8
2023/04/01 3年2組 Fさん 数学 23
2023/04/01 3年2組 Fさん 英語 1
2023/04/01 3年3組 Gさん 国語 75
2023/04/01 3年3組 Gさん 数学 84
2023/04/01 3年3組 Gさん 英語 14
2023/04/01 3年3組 Hさん 国語 71
2023/04/01 3年3組 Hさん 数学 32
2023/04/01 3年3組 Hさん 英語 0
2023/04/01 3年3組 Iさん 国語 85
2023/04/01 3年3組 Iさん 数学 12
2023/04/01 3年3組 Iさん 英語 37
2023/06/01 3年1組 Aさん 国語 44
2023/06/01 3年1組 Aさん 数学 21
2023/06/01 3年1組 Aさん 英語 34
2023/06/01 3年1組 Bさん 国語 100
2023/06/01 3年1組 Bさん 数学 49
2023/06/01 3年1組 Bさん 英語 89
2023/06/01 3年1組 Cさん 国語 90
2023/06/01 3年1組 Cさん 数学 86
2023/06/01 3年1組 Cさん 英語 89
2023/06/01 3年2組 Dさん 国語 69
2023/06/01 3年2組 Dさん 数学 88
2023/06/01 3年2組 Dさん 英語 53
2023/06/01 3年2組 Eさん 国語 83
2023/06/01 3年2組 Eさん 数学 44
2023/06/01 3年2組 Eさん 英語 75
2023/06/01 3年2組 Fさん 国語 16
2023/06/01 3年2組 Fさん 数学 95
2023/06/01 3年2組 Fさん 英語 32
2023/06/01 3年3組 Gさん 国語 68
2023/06/01 3年3組 Gさん 数学 94
2023/06/01 3年3組 Gさん 英語 85
2023/06/01 3年3組 Hさん 国語 51
2023/06/01 3年3組 Hさん 数学 73
2023/06/01 3年3組 Hさん 英語 67
2023/06/01 3年3組 Iさん 国語 19
2023/06/01 3年3組 Iさん 数学 22
2023/06/01 3年3組 Iさん 英語 81
アプリを使って、実際に暗号化しました。

暗号化したデータをGoogleドキュメントに貼り付け、ファイル名をGemini暗号化サンプルにします。

⑤無料版Geminiで読み込む
はい、以下のようにGoogleドキュメントを読み込みます。
うまく読み込めました。

次に、集計させます。ピボット集計もできましたね。
つまりクラスや科目はPIIではありませんので集計が可能なのです。

最後に「すべてのデータの中で最も成績がいい人は誰ですか?」と個人を特定するような分析をしましたが、名前が暗号化されているため抽出はできませんでした。
「PII 情報を適切に処理する必要があるため、個人の成績を特定することはできません。」と回答されました。
クラスや科目での集計では問題ないのですが、個人を特定しようとすると拒否されるようです。
これは名前をカウントする集計全般に言えますので、この場合でも名前ではないユニークな番号をもたせると集計可能になるでしょう。
また、個人情報部分を回避して集計する代替え案も提示されています。

⑥おわりに
いかがでしたでしょうか?
無料版Geminiでも、生徒の名前を暗号化することで、集計は可能でした。
そして、「ユーザーの入力データを学習に利用」されたとしても、個人情報を暗号化しさえすればなんら問題ないことが分かります。
Gemini側でも、データ内容をチェックして、暗号化されたPIIの可能性があれば、その部分の集計はしないような仕組みを持っていました。
AIを利用する限り、PIIの漏洩はゼロリスクになることはありませんが、今回の方法で、無料版でも限りなくゼロリスクに近づけることは可能です。
