AIDB Daily Papers
人間とLLMの共著テキストを変化点検出でセグメンテーション
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 人間とLLMが共同執筆したテキストを、人間またはLLMが作成した部分に分割するアルゴリズムを提案した。
- この研究は、従来の時系列分析における変化点検出の考え方をLLM生成テキスト検出に応用した点が新しい。
- 提案手法は既存手法に対し優れた性能を示し、人間とLLMの共著テキストのセグメンテーションを可能にした。
Abstract
The rise of large language models (LLMs) has created an urgent need to distinguish between human-written and LLM-generated text to ensure authenticity and societal trust. Existing detectors typically provide a binary classification for an entire passage; however, this is insufficient for human--LLM co-authored text, where the objective is to localize specific segments authored by humans or LLMs. To bridge this gap, we propose algorithms to segment text into human- and LLM-authored pieces. Our key observation is that such a segmentation task is conceptually similar to classical change point detection in time-series analysis. Leveraging this analogy, we adapt change point detection to LLM-generated text detection, develop a weighted algorithm and a generalized algorithm to accommodate heterogeneous detection score variability, and establish the minimax optimality of our procedure. Empirically, we demonstrate the strong performance of our approach against a wide range of existing baselines.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: