LLMの文章には各モデルごとにさりげなく強い特徴があり、翻訳したり要約したあとでも痕跡がしっかり残るため判別できてしまうとの報告。
一見似ていたとしても機械的に分析すると簡単に見分けられるようです。それぞれのモデルが別の言葉を好む傾向にあるのが理由です。
ChatGPT、Claude、Grok、Gemini、DeepSeekのの出力を分類する場合、精度は97.1%。
面白いことに、最初の数トークンだけでも見分けられるそうです。
あとから違うモデルによる書き換えを行っても、元のモデルを特定できると述べられています。
さらに、同じモデルの異なるサイズ間の識別も可能。
カーネギーメロン大学、UCバークレー、ペンシルバニア大学、プリンストン大学の著名な研究者たちによる発表です。