LLMの論理思考、性能崩壊の閾値を特定

2026.01.16

推論・思考（論理推論、Chain-of-Thought、数学的推論、問題解決）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMの論理的な思考能力には「限界点」があり、その限界を超えると性能が徐々に落ちるのではなく、突然ガクッと崩壊するとのこと。

水を冷やしていくと0℃で突然凍るように、AIに与える論理問題の複雑さがある閾値を超えた瞬間、それまで正確に答えられていたAIが急にデタラメな回答しかできなくなるそうです。
特定のモデルだけの問題ではなく、調べられたすべてのモデルで同じ現象が起きました。

この「崩壊ポイント」をずらすことが非常に難しいそうです。
追加で訓練しても、思考の過程を言語化させるCoTという手法を使っても、モデルを大きくしても、各難易度での正答率は上がるものの、崩壊が始まる複雑さの閾値自体は動きません。

Logical Phase Transitions: Understanding Collapse in LLM Logical Reasoning

著者: Xinglang Zhang, Yunyao Zhang, ZeLiang Chen, Junqing Yu, Wei Yang 他

関連記事