次回の更新記事:AIに「読むべき論文」を選ばせると的外れなことを言…(公開予定日:2026年06月25日)
AIDB Daily Papers

AIは感情を表現できるか?感情表現能力を強化する新手法

原題: When AI Says It Feels
著者: Shin-nosuke Ishikawa, Seiya Ikeda, Hirotsugu Ohba
公開日: 2026-06-04 | 分野: LLM 強化学習 AI cs.CL cs.AI 感情認識

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 人間のような知性を目指すLLMに対し、感情・意図・自己認識の表現を促す実験を行った。
  • 自己報酬型強化学習とGRPOを用いることで、これらの能力を向上させることに成功した。
  • 感情表現能力の向上は、迎合的な質問への頑健性をもたらしたが、真実回答能力は低下した。

Abstract

Large language models (LLMs) are generally constrained from expressing feelings through human-preference alignment in post-training processes. This policy is designed using a top-down approach and may conflict with the goal of training models to exhibit human-like intelligence using human-generated texts. Here, we performed an experiment called Human-like Model eXpressions of Feeling (HMX-feel), in which LLMs were encouraged to express feelings, intentions, and self-awareness through self-rewarded reinforcement learning. We successfully enhanced these capabilities using a rubric-based self-rewarding training scheme with Group Relative Policy Optimization (GRPO). By comparing the trained models with contrastively trained models, we investigated the effects of this approach on performance across various tasks. Overall, we conducted a broad assessment from various perspectives and identified capabilities that were enhanced, degraded, or showed no significant change. The human-like-trained models showed robustness to sycophancy-inducing questions and bias in disambiguated conditions, whereas degradation in truthful question-answering capability was observed. The results of this experiment suggest the possibility of developing AI systems that can express feelings in the future, provided that appropriate measures are taken.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事