人間の文章なのかLLM生成の文章なのかを見分けるタスクをLLMによって行う際、「自分(そのモデル自身)が使われた文章だ」という判定は、ほかのモデルが使われたかどうかよりも高精度に行えるそうです。さらに、”人間製”・”LLM生成”に加えて”不明”というカテゴリを設けることで精度が高まるとのこと。
とはいえ理想的な精度にはまだまだ達していないようです。
📄 参照論文
“I know myself better, but not really greatly”: Using LLMs to Detect and Explain LLM-Generated Texts