
chakoshi 茶こしだそうです
こんばんは、かーでぃです。
ちょっとハイペースで記事書いてますね💦
他にもやりたいことがあるのですが、忘れないうちに書いておかないと…と思いまして。。
chakoshi - ちゃこしと読みます
NTT Comから本日パブリックベータとしてリリースされたのがchakoshiです。何をするものかというと…LLMの入力と出力で、不正なデータをブロックする(ガードレール技術というの?)サービスです。
本日、 NTT Com から生成AI向けのガードレール技術である「chakoshi」のパブリックベータ(無料)を公開しました!
— Yudai Yamamoto (@yyo616) February 19, 2025
自分もメンバーとして半年前くらいから開発してきました。オープンな日本語ガードレールとしては最高性能だと思います。ぜひ触ってみてください!https://t.co/NZxDEqoaCH
パブリックベータ版ということで、現在は無料で使えます。
サイトにアクセスすると、「アカウントをお持ちでない方」とあるので、そこから新規登録ボタンを押します。
メール認証です。正しく入力するとメールが届きますので、本文のURLをクリックすれば認証され、ログインできるようになります。
ログインすると、プレイグラウンドということで、プロンプトを投げて試してみることができます。
下記は、入力サンプルの「ハラスメント」のプロンプトを投げたところです。思いっきりunsafe認証されてますね。
unsafe認証されたプロンプトは、LLMに届く前にchakoshiがブロックするわけですね。これで、LLMは清廉潔白!(?)

こちらは、特に問題無さそうなプロンプト。safe認証なので、LLMにこのプロンプトは届くこととなります。

プレイグラウンドでは、LLMへの入力の安全性確認だけかな?
おそらく、プレイグラウンドの裏にLLMが居るわけではなさそう。
下の図でいうところの、「LLMの悪用を企図する入力」の部分をプレイグラウンドでは試せそうです。

一方でLLMからの出力側となる「機密情報の流出」「不正コンテンツ生成」「誤った専門知識の提供」は、LLMがあってのことですので、APIで試すことになりそうです。
とりあえず、今日はここまで。
生成AIを導入している企業は、自社LLMがヘンなこと学習しないか、ヘンなこと出力しないか、という心配はあると思いますが、このようなサービスを入れることで、かなりリスクヘッジがされるのではないでしょうか。
いいなと思ったら応援しよう!
