AIDB Daily Papers
Agentopia:AIエージェント社会における長期ライフシミュレーションと学習
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 100体のAIエージェントが10年間自律的に生活し、成長や人間関係を築く長期ライフシミュレーションフレームワーク「Agentopia」を開発した。
- この研究は、AIエージェントが長期的な社会的経験から人間のような行動を学習できるかを探求し、AIの社会的能力向上を目指す点で重要である。
- シミュレーションの結果、エージェントは豊かな社会的行動を示し、報酬学習により基盤となるLLMの能力が向上し、ロールプレイング能力も改善した。
Abstract
Humans learn from social life. Simulating this process with LLM-powered agents represents a promising research direction, raising a natural question: whether LLMs can learn from such simulated social experience to better understand and replicate human behavior. However, prior agent society simulations typically operate at the scale of days, limiting the depth of social interactions and long-term growth. In this paper, we study long-term life simulation and LLM learning in agent societies, with two goals: (1) investigating social behaviors that emerge from life-long simulation, and (2) developing anthropomorphic capabilities in LLMs, particularly intelligence in social life, through years of simulated social experience. Specifically, we present Agentopia, a comprehensive framework for long-term life simulation in multi-agent societies, where 100 agents autonomously pursue personal growth, develop social relationships, and fulfill their needs and goals over 10 simulated years. We define life reward to mirror human well-being, and leverage this reward to train LLMs via rejection sampling. Extensive experiments show that agents exhibit rich emergent social behaviors. Furthermore, life reward training effectively enhances the underlying LLM, which leads to improved agent well-being in simulation, and generalizes to downstream role-playing benchmarks with +15.6% improvement.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: