Many-shot jailbreaking
Anthropicが発表した「Many-shot jailbreaking」という技術に関する研究では、大規模言語モデル(LLM)が開発者によって設定された安全ガードを回避する方法について調査しています。この技術は、LLMが処理できる入力の量、つまりコンテキストウィンドウが急速に拡大したことを利用しています。2023年初頭には、コンテキストウィンドウのサイズは長いエッセイ程度(約4000トークン)でしたが、現在では数百倍大きくなり、複数の長編小説に匹敵するサイズ(100万トー