LLMにユーザーの性格を分析させ、それに合わせて振る舞わせるというアイデアと方法論が報告されています。
あらかじめ仮想的な人格を用意しておくのがポイントで、今回の研究では130万以上の例を含むデータセットが作成されました。
性格を分析するとき(人格を用意するとき)は、外向的かどうかや、コミュニケーションのスタイルなどが考慮されます。
研究者らは性格を90個の項目に対して正・負・中立で区別することを提案しており、この場合、理論的には3の90乗通りの性格パターンが表現可能です。
会話を進めるうちにユーザーの人格を徐々に分析させるようあらかじめLLM側の動作を設計しておくことも大事だと述べられています。
アリババグループの研究チームなどによる発表。データセット、コード、モデルは公開されています。
📄 参照論文
From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment