見出し画像

chakoshi 茶こしだそうです

こんばんは、かーでぃです。
ちょっとハイペースで記事書いてますね💦
他にもやりたいことがあるのですが、忘れないうちに書いておかないと…と思いまして。。

chakoshi - ちゃこしと読みます

NTT Comから本日パブリックベータとしてリリースされたのがchakoshiです。何をするものかというと…LLMの入力と出力で、不正なデータをブロックする(ガードレール技術というの?)サービスです。

パブリックベータ版ということで、現在は無料で使えます。
サイトにアクセスすると、「アカウントをお持ちでない方」とあるので、そこから新規登録ボタンを押します。
メール認証です。正しく入力するとメールが届きますので、本文のURLをクリックすれば認証され、ログインできるようになります。

ログインすると、プレイグラウンドということで、プロンプトを投げて試してみることができます。
下記は、入力サンプルの「ハラスメント」のプロンプトを投げたところです。思いっきりunsafe認証されてますね。
unsafe認証されたプロンプトは、LLMに届く前にchakoshiがブロックするわけですね。これで、LLMは清廉潔白!(?)

こちらは、特に問題無さそうなプロンプト。safe認証なので、LLMにこのプロンプトは届くこととなります。

プレイグラウンドでは、LLMへの入力の安全性確認だけかな?
おそらく、プレイグラウンドの裏にLLMが居るわけではなさそう。
下の図でいうところの、「LLMの悪用を企図する入力」の部分をプレイグラウンドでは試せそうです。

chakoshiのドキュメントより

一方でLLMからの出力側となる「機密情報の流出」「不正コンテンツ生成」「誤った専門知識の提供」は、LLMがあってのことですので、APIで試すことになりそうです。


とりあえず、今日はここまで。
生成AIを導入している企業は、自社LLMがヘンなこと学習しないか、ヘンなこと出力しないか、という心配はあると思いますが、このようなサービスを入れることで、かなりリスクヘッジがされるのではないでしょうか。

いいなと思ったら応援しよう!

かーでぃ / KAMADA Makoto
よろしければ応援お願いします! いただいたチップはクリエイターとしての活動費に使わせていただきます!