LLMとの対話で人間の道徳観が変化

2026.05.03

安全性・アライメント（AIの安全性、アライメント、jailbreak、ハルシネーション対策）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMの道徳観は人間にうつる？

ケンブリッジ大学などの研究チームによる実験では、特定の道徳観を埋め込んだLLMと人間が対話すると、人間自身の道徳観がそのLLMの方向に引っ張られることが示されています。
また、その効果は2週間後もほぼ維持されたとのことです。

たとえば、”義務論”を埋め込んだLLMと対話した参加者は、中絶・安楽死・銃規制といった現実の社会政策に対しても、より保守的な評価を示すようになりました。

「LLMにどんな倫理を埋め込むか」という議論は、機械の振る舞いを規定するだけでなく、利用者の道徳観そのものを書き換えてしまう影響まで視野に入れて行う必要があるのかもしれません。

こちらもどうぞ