次回の更新記事:ハルシネーションは「AIのせい」だけではなく「クエ…(公開予定日:2026年03月05日)
AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

対話の中でユーザーの好みを学ぶ手法『CIPHER』 (プロンプトテンプレートあり)

2024.10.03
深堀り解説

本記事では、LLMとユーザーの対話の中で得られるユーザーフィードバックを活用してLLMの応答をパーソナライズする新手法を紹介します。

モデルを個別のユーザーに対してパーソナライズする方法はいくつか考案されてきましたが、最適なアプローチはまだ見つかっていません。そんな中、今回Cornell大学やMicrosoftの研究者らは、対話の中で自然に得られるユーザーからの返事をフィードバックとして活用する効率的な手法を提案しています。

この手法を使うとモデルがユーザーの好みを解釈して自然言語で説明できる点も特徴となっています。

参照論文情報

  • タイトル:Aligning LLM Agents by Learning Latent Preference from User Edits
  • 著者:Ge Gao, Alexey Taymanov, Eduardo Salinas, Paul Mineiro, Dipendra Misra
  • 研究機関:Cornell University, Microsoft Research

背景

LLMやLLMエージェントは、様々なアプリケーションで活用されるようになってきました。しかし、個々のユーザーや特定のタスクに適応するパーソナライズ機能においてはまだ十分とは言えません。

従来のフィードバック手法、例えば比較ベースの強化学習などは、専門の注釈者に複数のモデル応答を提示して順位付けをしてもらう必要があるため、コストがかかります。

さらに現実問題、各ユーザー向けにLLMエージェントをパーソナライズするのは本来であれば非常にコストがかかります。もしLLMのパラメータを微調整するとなれば、安全性が失われるリスクもあります。

そこでCornell大学やMicrosoftの研究者らは「対話の中で得られるユーザーのフィードバックも、LLMエージェントがユーザーの好みを学ぶ貴重な情報源なのではないか」と考えました。

多くのアプリケーションでは、ユーザーはLLMの出力に対して訂正を行うことがよくあります。つまり、ユーザーはLLMに指示を出して出力を得ますが、最終的にはLLMの応答をユーザーが必要なだけ編集して使用しているのです。

研究者らは、これまでの提案手法に代わるものとして「ユーザーの嗜好を推論し、応答生成に利用するプロンプトポリシーの学習」に焦点を当てることにしました。これはコスト効率、安全性の両面から優れたアプローチとなる可能性があります。

以下で手法や実験結果を紹介します。

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

記事検索

年/月/日
年/月/日

関連記事