次回の更新記事:誤解を招きやすいAI用語6選、技術語なのに揺れる意味(公開予定日:2026年04月30日)
AIDB Daily Papers

AIシステムの安全を守る:自然言語リクエストのポリシー遵守評価

原題: Policy Compliance of User Requests in Natural Language for AI Systems
著者: Pedro Cisneros-Velarde
公開日: 2026-02-27 | 分野: LLM NLP 安全性 ベンチマーク AI

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • AIシステムへの自然言語リクエストが組織のポリシーに準拠しているかを評価する研究を行った。
  • 安全かつ信頼できるAI利用のため、多様なポリシーに対するリクエストの遵守度を評価する初のベンチマークを提案した点が新しい。
  • 様々なLLMモデルをベンチマークで評価し、モデルや手法による性能差を分析、問題の難しさを示した。

Abstract

Consider an organization whose users send requests in natural language to an AI system that fulfills them by carrying out specific tasks. In this paper, we consider the problem of ensuring such user requests comply with a list of diverse policies determined by the organization with the purpose of guaranteeing the safe and reliable use of the AI system. We propose, to the best of our knowledge, the first benchmark consisting of annotated user requests of diverse compliance with respect to a list of policies. Our benchmark is related to industrial applications in the technology sector. We then use our benchmark to evaluate the performance of various LLM models on policy compliance assessment under different solution methods. We analyze the differences on performance metrics across the models and solution methods, showcasing the challenging nature of our problem.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事