AIDB Daily Papers
AIシステムの安全を守る:自然言語リクエストのポリシー遵守評価
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- AIシステムへの自然言語リクエストが組織のポリシーに準拠しているかを評価する研究を行った。
- 安全かつ信頼できるAI利用のため、多様なポリシーに対するリクエストの遵守度を評価する初のベンチマークを提案した点が新しい。
- 様々なLLMモデルをベンチマークで評価し、モデルや手法による性能差を分析、問題の難しさを示した。
Abstract
Consider an organization whose users send requests in natural language to an AI system that fulfills them by carrying out specific tasks. In this paper, we consider the problem of ensuring such user requests comply with a list of diverse policies determined by the organization with the purpose of guaranteeing the safe and reliable use of the AI system. We propose, to the best of our knowledge, the first benchmark consisting of annotated user requests of diverse compliance with respect to a list of policies. Our benchmark is related to industrial applications in the technology sector. We then use our benchmark to evaluate the performance of various LLM models on policy compliance assessment under different solution methods. We analyze the differences on performance metrics across the models and solution methods, showcasing the challenging nature of our problem.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: