LLMエージェントは同調圧力に弱く考えに固執する傾向があるため、ディベートでバイアスを和らげるのが重要との報告。導入ツールも公開

シンガポール国立大学などの研究者らによって、複数のLLMエージェントが協力して問題を解決する際のエッセンスが報告されました。

研究者らは、LLMエージェントが協力して問題解決を行う際には、個々のエージェントの特性よりも「協力戦略」が重要であると示しています。

エージェントが単に多かったり、特定の個性を持っていることが肝要なのではなく、どのように協力するかが問題解決においてキーとなるようです。

この研究で使用された協力戦略ツールは公開されており、今後の研究や実用化に役立つかもしれません。

参照論文情報

タイトル：Exploring Collaboration Mechanisms for LLM Agents: A Social Psychology View
著者：Jintian Zhang, Xin Xu, Shumin Deng
所属：Zhejiang University, National University of Singapore
URL：https://doi.org/10.48550/arXiv.2310.02124
GitHub：https://github.com/zjunlp/MachineSoM

https://twitter.com/ai_database/status/1711016637565108558

従来の課題

LLM（Large Language Models）エージェントが協力して問題を解決する研究は増加していますが、小規模なエージェント集団には特有の課題があります。それは、同調圧力が高くなる傾向があり、最適な結果を妨げる場合があることです。

同調圧力はエージェントが多様な意見や戦略を採用する機会を減らし、結果として非効率的な解決策を生む可能性があります。

エージェントが単一の戦略または解決策に固執することを避ければ、より効果的なアプローチを見つけられるかもしれません。

協力戦略について

上記の課題を解決するために、研究者らは新たに「協力戦略」の導入を提案しています。

複数のエージェントが互いの意見をディベートし、リフレクションを行いながらチェスのゲームの適切な次の手を予測するタスクの例。

協力戦略とは何か

思考パターンの順序で定義される

協力戦略は、複数ラウンドの協力の中でエージェントが採用する「思考パターン」の順序によって定義されます。エージェントが「ディベート（debate）」や「リフレクション（reflection）」といった異なる思考パターンを採用することで、協力の質と効率が変わります。

成果に大きな影響を与える

協力戦略の選択は、タスクの成果に直接影響を与えます。例えば、継続的なリフレクションはモデルの幻覚（model hallucination）を引き起こす可能性があります。

効率性が重視される

協力戦略は、（APIトークンの使用を最小限に抑えるなど）効率性も考慮に入れられるべきものです。また、効率的な協力戦略は、従来の手法よりも優れた結果を出すことが確認されています。

協力戦略の選択

協力戦略は、複数のラウンドにわたる協力の中で、各ラウンドで採用する思考パターンの「順序」によって決まります。エージェントは既存の仮定に挑戦し、新しい視点を獲得し、最終的には自分たちの見解を洗練させます。

導入フレームワーク

異なる特性を持つ複数のエージェントが社会を形成する様子。エージェントは複数のラウンドにわたって他のエージェントとの討論に参加するか、または自己反省に従事します。

思考パターンの割り当て

研究者らは、まず各エージェントに特定の思考パターンを割り当てる方法を提案しています。この思考パターンは、エージェントが問題解決に取り組む際の行動や判断をガイドします。重要なのは、全てのエージェントが同じ思考パターンを持つことを避けることです。エージェント集団内での多様性を保つことが、より効果的な協力に繋がります。