AI同士のコミュニティに「うわさ話」システムを導入したところ、意外にも自己中心的に振る舞うエージェントでさえ長期的な利益のために協力するようになったと報告されています。
噂話によって評判が形成され、評判の悪い相手は誰からも協力してもらえなくなる現象が起きたため。
面白いことに、嘘の噂が混ざっていても、現代の賢いモデルは真実を見抜けるそうです。
また、単純な「あのAIは良い/悪い」の二択評価より、称賛から批判まで段階的な評価のほうが、協力を促すのに効果的だったとのこと。
もし将来たくさんのAIエージェントが社会で活動するようになったら、どうやって秩序を保つかという問題に遭遇しそうです。
こうした評判システムなどの工夫を重ねればAIたちも自発的に協力し合えるかもしれません。
📄 参照論文
Talk, Judge, Cooperate: Gossip-Driven Indirect Reciprocity in Self-Interested LLM Agents
所属: University of Waterloo, Vector Institute, The Chinese University of Hong Kong