次回の更新記事:今週の注目AI論文リスト(論文公開日2026/2/1~2/7)(公開予定日:2026年02月08日)
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

LLMの性格付与で認知バイアス発現

安全性・アライメント(AIの安全性、アライメント、jailbreak、ハルシネーション対策)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMに性格を与えると、それに基づく判断の歪み(認知バイアス)が起こる可能性があるとの報告。

性格の種類によって、どのような判断ミスを起こしやすいかが違うそうです。
例えば、『外向的』や『協調的』な状態のモデルは特定の情報に強く影響されやすいとのこと。これはGPT-4oで特に観察されました。

面白いことに、「認知バイアスに気を付けて」と指示すると、『誠実』な状態のモデルには良好な効果がある(正しく気を付けられるようになる)ことが示されました。

ただし特定の性格になるように指示を与えても、その影響はバラバラで、もとのモデルが持つ特性に引っ張られている可能性があるとのことです。

📄 参照論文

Investigating the Impact of LLM Personality on Cognitive Bias Manifestation in Automated Decision-Making Tasks

著者: Jiangen He, Jiqun Liu

関連記事