AIDB Daily Papers
モデル動物園のCUPID:夢のLLMを選ぶオンラインマッチメイキング
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- ユーザーの潜在的嗜好を推測し、最適なLLMを効率的にマッチングする手法を提案した。
- 対話型アクティブラーニングとデュアルバンディットアルゴリズムを組み合わせ、ユーザーの不明瞭な要求にも対応可能とした点が新しい。
- 多様な実験と人間研究により、低コストでユーザーのニーズに合致したLLMを効率的に選択できることを実証した。
Abstract
Users increasingly face the challenge of selecting an appropriate LLM for a given task from a rapidly growing pool of LLMs, each with distinct but often opaque latent properties. Compounding this challenge, users may lack the vocabulary or awareness to explicitly articulate the characteristics they value in an LLM's responses or deployment. We propose an interaction-efficient active learning framework in which a dueling bandit algorithm iteratively selects pairs of LLMs, collects user feedback about their responses, and updates its belief about the user's latent preferences. We introduce a novel belief-aware upper confidence bound strategy that balances exploration of the model pool with exploitation of inferred preferences, enabling efficient alignment between user needs and LLM capabilities under user-specified cost and time budgets. Through diverse experiments on LLMs and human studies, we experimentally verify that our model can efficiently match well-aligned LLMs to users at a lower cost.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: