AIDB Daily Papers
LLMは文脈からグラフ構造を学習するか?内部表現と因果推論による検証
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- LLMの文脈内学習メカニズムを、2つの異なるグラフ構造を持つランダムウォークタスクで調査した。
- 内部表現のPCA分析と活性化パッチングにより、局所的なパターンマッチングと構造推論の並列動作を示唆する。
- LLMは、真の構造推論回路と誘導回路が並行して動作する二重メカニズムで学習している可能性が高いと結論づけた。
Abstract
How do LLMs learn in-context? Is it by pattern-matching recent tokens, or by inferring latent structure? We probe this question using a toy graph random-walk across two competing graph structures. This task's answer is, in principle, decidable: either the model tracks global topology, or it copies local transitions. We present two lines of evidence that neither account alone is sufficient. First, reconstructing the internal representation structure via PCA reveals that at intermediate mixture ratios, both graph topologies are encoded in orthogonal principal subspaces simultaneously. This pattern is difficult to reconcile with purely local transition copying. Second, residual-stream activation patching and graph-difference steering causally intervene on this graph-family signal: late-layer patching almost fully transfers the clean graph preference, while linear steering moves predictions in the intended direction and fails under norm-matched and label-shuffled controls. Taken together, our findings are most consistent with a dual-mechanism account in which genuine structure inference and induction circuits operate in parallel.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: