次回の更新記事:研究者たちがAIエージェントのセキュリティを本気で…(公開予定日:2026年04月11日)
AIDB Daily Papers

他者の人生を生きる:LLMが生成する心理測定プロファイルに基づいた人生の物語の往復評価

原題: Stories of Your Life as Others: A Round-Trip Evaluation of LLM-Generated Life Stories Conditioned on Rich Psychometric Profiles
著者: Ben Wigler, Maria Tsfasman, Tiffany Matej Hrkalovic
公開日: 2026-04-07 | 分野: LLM NLP 機械学習 AI 感情 評価 心理 言語 テキスト 行動 生成 自然言語処理 深層学習 大規模 人工知能

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 大規模言語モデル(LLM)に個人の心理測定プロファイルを条件付けし、一人称の人生の物語を生成する研究を行った。
  • 生成された物語から独立したLLMが性格スコアを回復できるかを検証し、個人差の表現をどれだけ頑健に符号化できるか検証した点が新しい。
  • 生成された物語から性格スコアが人間の再検査信頼性に匹敵するレベルで回復可能であり、感情的な反応パターンが実際の会話データと一致することを示した。

Abstract

Personality traits are richly encoded in natural language, and large language models (LLMs) trained on human text can simulate personality when conditioned on persona descriptions. However, existing evaluations rely predominantly on questionnaire self-report by the conditioned model, are limited in architectural diversity, and rarely use real human psychometric data. Without addressing these limitations, it remains unclear whether personality conditioning produces psychometrically informative representations of individual differences or merely superficial alignment with trait descriptors. To test how robustly LLMs can encode personality into extended text, we condition LLMs on real psychometric profiles from 290 participants to generate first-person life story narratives, and then task independent LLMs to recover personality scores from those narratives alone. We show that personality scores can be recovered from the generated narratives at levels approaching human test-retest reliability (mean r = 0.750, 85% of the human ceiling), and that recovery is robust across 10 LLM narrative generators and 3 LLM personality scorers spanning 6 providers. Decomposing systematic biases reveals that scoring models achieve their accuracy while counteracting alignment-induced defaults. Content analysis of the generated narratives shows that personality conditioning produces behaviourally differentiated text: nine of ten coded features correlate significantly with the same features in participants' real conversations, and personality-driven emotional reactivity patterns in narratives replicate in real conversational data. These findings provide evidence that the personality-language relationship captured during pretraining supports robust encoding and decoding of individual differences, including characteristic emotional variability patterns that replicate in real human behaviour.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事