次回の更新記事:オープンモデルなのにClaudeなどに匹敵するとされる…(公開予定日:2026年06月25日)
AIDB Daily Papers

文脈を考慮したAIの道徳的信念形成:価値整合性のための新たなアプローチ

原題: Accounting for Context: Shaping Moral Credences for Value Alignment
著者: Jazon Szabo, Sanjay Modgil
公開日: 2026-06-05 | 分野: AI 倫理 cs.AI アライメント AI安全性 AIガバナンス

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 本研究は、AIの行動を人間の道徳的価値に整合させるために、多様な道徳的視点を考慮した意思決定モデルを提案した。
  • 従来の道徳的不確実性研究に加え、文脈依存性を考慮することで、現実世界におけるAIの意思決定の重要性と新規性を示した。
  • 文脈を無視した集約メカニズムでは弱パレート原則が破れることを示し、これはシンプソンのパラドックスの一種であることを発見した。

Abstract

Ensuring that agent behaviours are aligned with human moral values inevitably raises the problem of how to account for the plurality of moral perspectives that societies -- and even individuals -- typically adopt. Work on moral uncertainty proposes mechanisms to fairly and democratically aggregate evaluations of actions across different moral theories. However, this paper argues that one needs to account for contextual factors when aggregating moral evaluations. For example, consequentialist perspectives assume an ability to accurately determine how an agent's actions change the world; an assumption that often does not hold in real world settings. We, therefore, formalise agent decision making under moral uncertainty, while also accounting for these kinds of contextual factors. We thereby show that a seemingly commonsensical property -- the weak Pareto principle -- is violated. We argue that this apparent problem is, in fact, a variation of Simpson's paradox, and hence reveals the limitations of aggregation mechanisms that ignore the impact of contextual factors.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事