AIDB Daily Papers
大規模言語モデルによるゼロショット目標認識
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 大規模言語モデル(LLM)を、計画タスクにおける目標認識のゼロショット評価に用いた研究である。
- LLMは、計画生成とは異なり、世界知識の活用が中心となる目標認識タスクに強みを持つ可能性がある。
- 一部のLLMは証拠が増えるにつれて精度が向上するが、他は証拠量に関わらず事前知識に依存する傾向が見られた。
Abstract
Large language models have recently reached near-parity with classical planners on well-known planning domains, yet this competence relies on world-knowledge exploitation rather than genuine symbolic reasoning. Goal recognition is a complementary abductive task structurally better suited to LLM strengths: it consists of evaluating consistency with world knowledge rather than generating novel action sequences. This paper provides the first systematic zero-shot evaluation of frontier LLMs as goal recognisers on key classical PDDL benchmarks. Our results show that LLM competence on goal recognition is uneven: some models scale with evidence and approach landmark-based accuracy at full observations, while others remain anchored to world-knowledge priors regardless of how much evidence accumulates. Qualitative analysis of model reasoning traces reveals that this divergence reflects a fundamental difference in evidence integration rather than domain familiarity. These findings position goal recognition as a principled benchmark for the foundational planning knowledge of LLMs.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: