LLMを使用することで「画像の中に長い文章を目に見えない形で隠す」ことが可能になったと報告されています。
実験では、猫の写真のような普通の画像に長い論文の要約を隠しても、画像の見た目はほとんど変わらず、しかも隠した文章を高い精度で復元できることが多いと確認されました。
たとえば256×256ピクセルの画像に、最大500語もの文章を隠すことに成功しています。
仕組みとしては、隠したい文章をトークンに変換し、それを画像全体に分散させて埋め込みます。
取り出すときは、同じ言語モデルが画像から情報を読み取って、元の文章を復元します。
ただし、意味のある自然な文章を隠すことはできますが、ランダムな数字の羅列のような意味のない情報は苦手とのことです。
こうした技術はいわゆるステガノグラフィーです。
研究者らは「検出器を欺けるほど秘匿性が高い」と警告しています。
📄 参照論文
S^2 LM: Towards Semantic Steganography via Large Language Models
所属: Fuzhou University, Beijing University of Technology