LLMの文章、モデル固有の痕跡で高精度識別

2025.03.14

評価・ベンチマーク（モデル評価、ベンチマーク、性能測定）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMの文章には各モデルごとにさりげなく強い特徴があり、翻訳したり要約したあとでも痕跡がしっかり残るため判別できてしまうとの報告。

一見似ていたとしても機械的に分析すると簡単に見分けられるようです。それぞれのモデルが別の言葉を好む傾向にあるのが理由です。

ChatGPT、Claude、Grok、Gemini、DeepSeekのの出力を分類する場合、精度は97.1%。

面白いことに、最初の数トークンだけでも見分けられるそうです。
あとから違うモデルによる書き換えを行っても、元のモデルを特定できると述べられています。
さらに、同じモデルの異なるサイズ間の識別も可能。

カーネギーメロン大学、UCバークレー、ペンシルバニア大学、プリンストン大学の著名な研究者たちによる発表です。

Idiosyncrasies in Large Language Models

著者: Mingjie Sun, Yida Yin, Zhiqiu Xu, J. Zico Kolter, Zhuang Liu

こちらもどうぞ