LLMに個人やペルソナを演じさせる際に「内面から」模倣させる技術。
スタンフォード大学らの研究チームによると、心理学的な6つの軸に沿ってモデルを強化学習することで「その人らしい」「人間らしい」をこれまでにない精度で実現できたとのこと。
プロンプトで表面的に模倣させる手法から一歩踏み 込んだ取り組みです。
実験では、ニュースコメントから書籍レビュー、政治ブログ、メールまで6領域を網羅し、約2万6千人の実在ユーザーによる約21万6千件の応答を含む大規模なデータで検証したところ、この手法が最良という結果に。
研究者らは、これまでの心理学の知見から、人の内面は「信念・目標・感情・価値観・立場・コミュニケーション方式」でラベル付け可能であると考えました。
今回の手法は、この6軸に沿って、LLMに「このユーザーはこの文脈で何を思い、どう感じ、何を目指しているか」を推論させ、その推論結果をもとに強化学習を行うというもの。
111名によるリアルタイム実験でも最高の評価を受けています。