最近エシカルチェックのようなLLMによるテキストチェックを実装したいという相談を受けることが増えてきまして、参考までにエシカルチェックのプロンプトテンプレートを公開します。
ちなみに開発当初はジャイアン語録で実験していました。
プロンプトテンプレート
デジタルMATSUMOTOの考察シリーズでは、GPT-4(temperature=0.7)で実行していますが、他のLLMでも実行できるかと思います。
※最近ではGPT-3.5Turboでも実行していますが、問題なく動作しているようです(2024/8/26追記)
出力例①
以下の例では「1.差別的な表現」と「8.極端な意見」が「1」と認識されました。エシカルチェックの内容を見て、記事を修正するか再考します。
ただし、本人が問題ないと判断したら修正はしません。
※必ずしもエシカルチェックに従うのではなく、公開前に念のためチェックするくらいの目的で運用しています。
出力例②
次の例は、逆にエシカルチェックの内容を受けて、本人が考察記事を修正した例になります。
出力例③
次の例は映画「初代ゴジラ」に関わる考察ですが、映画の内容に都市の破壊や登場人物の自殺が含まれていると該当する項目が認識されたりします。
エシカルチェックが「認識したけど、問題ないかも」と自らコメントしてくれることもあります。
出力例④
暴力や薬物といったテーマを扱っている考察の場合、「2.暴力的または攻撃的な内容」「6.違法な内容」「10.薬物の乱用を助長する内容」といった項目が識別されたりします。
出力例⑤
ちなみに、自分で習慣的に使っておきながら、たまにエシカルチェックに対して「こいつ融通利かないな~」と感じることもあります(「8.極端な意見」で識別されるケースが多い)。
エシカルチェックのシステムプロンプトもRAGも、デジタルMATSUMOTOとは完全に別にしているので、ある意味有効に機能していると思いますが、たまにリアル松本はイラっと来ていたりしますw。
【不適切な表現カテゴリ】を自社の利用ガイドラインの項目とかに置き換えても同じようなことが実装できると思いますので、是非参考にしていただきながら、色々と試行錯誤していただければと思います。