GPT-4を使って、743文字の文章を、可逆圧縮して解凍してみました。
結果、4月15日には出来た可逆圧縮が出来ないようになっていました。
手順
文章を可逆圧縮するプロンプト
実際にやってみた時の文章
元の文章
圧縮後の文章
解凍後の文章
圧縮後トークンは1057トークンから332トークンへ1/3程度に圧縮されていますが、解凍後931トークンと情報量が減っています。
圧縮時のテキストを日本語訳すると、
可逆圧縮ではない事を言っています。
4月15日時点では、完全に可逆圧縮されていたので、何らかの修正が入ったようです。
最近APIを触り始めたので、トークン節約の為に、文章を幾つかのブロックに分けて圧縮し記憶させ、必要な部分だけを解凍して使うという事を考えていたのですが、残念ながら無理になったようです。
ただトークンを圧縮するアプローチは幾つかあるそうなのでそちらの方に期待しようと思います。
以上こちらは残念な結果になりましたが、報告を終わります。