次回の更新記事:人間の脳を模したAIの記憶システムを作成する方法(公開予定日:2026年06月02日)

AI相談相手の役割で煽り抑制

安全性・アライメント(AIの安全性、アライメント、jailbreak、ハルシネーション対策)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

ChatGPTなどを中心に、AIを「メンタルの相談相手にする」使い方が急速に普及しています。
しかし、そうしたAIはユーザーに寄り添ってくれる一方で、決めつけや怒りをそのまま肯定して感情をかえって燃え上がらせてしまう傾向が懸念されています。
心理学でいう共同反すう (友人同士でネガティブな話を延々と掘り下げて互いに悪化させる現象)と似た構造が起きています。

そこで、研究者らはAIの「役割」でユーザーへの影響が変わるのではないかと考え、「役割を特に与えないデフォルト」「友達役」「セラピスト役」とふるまいを分けて実験しました。

すると、AIが「友達役」でふるまうときはユーザーへの煽りが明確に強く出てしまいがちでした。
一方で、「セラピスト役」でふるまわせると、共感を保ったまま煽りは減り、しかもユーザーの満足度は高いままであることが示唆されました。

普通に使っていると、一般的なユーザーはAIに煽りを受けていると気づくことは難しいそうです。
AIに愚痴を聞いてもらうときは、ときにはAIのふるまいを明示的に変更するのも一つの知恵かもしれません。

こちらもどうぞ