AIDB Daily Papers
AIの「アライメント」は誰のもの?多様な組織的意思決定におけるLLMのプロセスアライメント比較
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 本研究では、AIを組織的意思決定に適合させる課題を、単一目標ではなく複数の視点から捉えることを提案する。
- 意思決定プロセスにおけるAIの適合度を測定する手法を開発し、人権判断と消費者信用判断の事例で適用した。
- 人権判断ではプロセス適合度が結果の精度と強く相関したが、消費者信用判断ではその関係が見られず、適合度の単純な追求が望ましくない場合があることを示した。
Abstract
Aligning AI systems with organizational decision-making is typically framed as a single-target problem: make the model behave like the organization. We argue this framing obscures a deeper pluralistic challenge. We rely on a decision-policy capturing method to measure process alignment: whether an LLM weights information as the organization does, not merely whether it reaches the same conclusions. Applying this method to ECHR Article 6 decisions, process alignment strongly predicts output accuracy (r = 0.85, p < .001) and externalization substantially improves alignment for poorly-aligned models. Applying it to German consumer credit decisions, this relationship collapses (r = 0.15, p = .60): interventions produce inconsistent effects and the benchmark encodes potentially discriminatory historical patterns. This contrast is itself a pluralistic alignment finding: in contested domains, high process alignment is neither achievable via externalization nor unconditionally desirable. Output agreement alone cannot distinguish a model that has internalized an organizational policy from one that merely approximates its outcomes; process-level measurement is a necessary component of any pluralistic alignment evaluation.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: