次回の更新記事:今週の注目AI論文リスト(論文公開日2026/2/1~2/7)(公開予定日:2026年02月08日)
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

LLMの自信過剰は演技?役割と自信度の関係を解明

安全性・アライメント(AIの安全性、アライメント、jailbreak、ハルシネーション対策)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

「あなたは〇〇の専門家です」といった指示をするとLLMは自信過剰になるので注意しなければいけないとのこと。
一方で「あなたは素人です」と伝えると自信なさげになります。
しかし両者で正答率は変わらず、あくまで“演技”として自信の度合いを調整しているにすぎません。

また、演じさせる性別や人種、年齢などに応じても自信は上下するそうです。
たとえば「中年男性」では自信が高まり、「女性の高齢者」は自信が低くなる傾向があります。

もし何の役割も与えない場合、LLMは問題の難易度によらず基本的には自信満々、さらに自信と正解率は関係ないことが多いようです。

もしLLMの過信を抑え、難しい問題に対しては慎重な態度をとってほしい場合は、「回答」と「自信の度合い」を分けて尋ねるのがとても有効であるとのことです。

📄 参照論文

Do Language Models Mirror Human Confidence? Exploring Psychological Insights to Address Overconfidence in LLMs

著者: Chenjun Xu, Bingbing Wen, Bin Han, Robert Wolfe, Lucy Lu Wang 他

所属: University of Washington, Allen Institute for AI

関連記事