チャットボットを開発しているとしましょう。リリース前に「いろんなタイプのユーザー」でテストしたい。でも、実際に何千人もの被験者を集めるのはコストも時間もかかります。そこでLLMに「架空の人物像=ペルソナ」を作らせて、シミュレーション上でテストするというアプローチが行われています。LLMに「30代・男性・やや内向的な性格で……」といったプロフィールを生成させ、そのキャラクターとしてアンケートに答えさせたり、会話をさせたりする。いわゆる「合成ペルソナ」による仮想ユーザーテストです。

ところが、ここにやっかいな壁があります。LLMに「多様な人格を作って」と頼んでも、実際に出てくるのは似たり寄ったりの人たちなのです。
そんな問題に向き合った研究事例を紹介します。