LLMは高度な心の推測が得意で基本的な理解が苦手、人間と逆

2026.02.01

推論・思考（論理推論、Chain-of-Thought、数学的推論、問題解決）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

人間とLLMは心の理論（他者の気持ちを推測する力）の成り立ちがハッキリ異なると報告されています。

たとえば人間は「あの人は○○が好き／○○が見えてる」という基本的な理解から「あの人はこう考えている」と応用的な推測を進めます。
一方でLLMはこの順序がまるっきり逆であるとのこと。

LLMは「あの人はこう考えている」と応用的な推測は得意である一方、最先端モデルであっても「あの人は○○が好き／○○が見えてる」という基本的な理解のほうがスコアが伸び悩みます。
現状、人間にとっては簡単なはずの基本的理解でむしろLLMは苦戦しているです。

研究者らはこれを昔からロボット分野にある「モラベックのパラドックス」と呼ばれる現象の一種だと考えています。「推論よりも感覚や運動の方がよりたくさんの計算が必要になる」という考え方です。
身体感覚や視点の違いといった、言葉だけでは学びにくい基礎的な部分を発達させることがAIの今後の課題であると改めて浮き彫りになりました。

📄 参照論文

CogToM: A Comprehensive Theory of Mind Benchmark inspired by Human Cognition for Large Language Models

著者: Haibo Tong, Zeyang Yue, Feifei Zhao, Erliang Lin, Lu Jia 他

所属: BrainCog Lab, Institute of Automation, Chinese Academy of Sciences

📎 論文を読む（arxiv.org）

X（Twitter）で見る

LLMは高度な心の推測が得意で基本的な理解が苦手、人間と逆

📄 参照論文

関連記事

AIが就活して成長する市場で強かったのは「自己理解が深い」AIエージェント

🔒 Metaのリアルタイム多言語間翻訳システム『Seamless（シームレス）』は話し方のトーンや抑揚も反映

🔒 開発企業や言語ごとに異なるLLMのイデオロギー、価値観や態度

🔒 OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

🔒 「この製品が出たら買う？」消費者調査で人間の代わりにLLMを上手く使う手法

🔒 大規模言語モデルが音声をダイレクトに理解する能力を与える　Metaとケンブリッジ大

📄 参照論文

📚 関連記事

関連記事

AIが就活して成長する市場で強かったのは「自己理解が深い」AIエージェント

🔒 Metaのリアルタイム多言語間翻訳システム『Seamless（シームレス）』は話し方のトーンや抑揚も反映

🔒 開発企業や言語ごとに異なるLLMのイデオロギー、価値観や態度

🔒 OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮

🔒 「この製品が出たら買う？」消費者調査で人間の代わりにLLMを上手く使う手法

🔒 大規模言語モデルが音声をダイレクトに理解する能力を与える Metaとケンブリッジ大

🔒 大規模言語モデルが音声をダイレクトに理解する能力を与える　Metaとケンブリッジ大