LLMにハイレベルな問題の解決アプローチを自分で考えさせるエージェント化手法「SelfGoal」

   

特定の高難易度タスクにおけるLLMエージェントの性能を大幅に向上させる新しい手法SelfGoalが考案されました。最終目標をより実践的なサブゴールのツリー構造に分解し、状況に応じてサブゴールを更新するのが本手法の肝です。

重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。



参照論文情報

  • タイトル:SelfGoal: Your Language Agents Already Know How to Achieve High-level Goals
  • 著者:Ruihan Yang, Jiangjie Chen, Yikai Zhang, Siyu Yuan, Aili Chen, Kyle Richardson, Yanghua Xiao, Deqing Yang
  • 所属:Fudan University, Allen Institute for AI

背景

LLMエージェントは、ゲームやプログラミングなどの分野でよく利用されています。タスク固有の学習をすることなく、複雑で難易度の高いタスクを自動的に解決する技術として、注目されてきています。

しかし、LLMエージェントには、「ユーザーからの曖昧な指示に従えない」などの課題があります。例えば、「この勝負に勝ってください」や「お金を稼いでください」といった、抽象的な指示を与えても、エージェントはユーザーの意図を汲み取れず、タスクを遂行できないでしょう。

こうした課題を解決し、難易度の高いタスクを自動でLLMに解かせるために、既存の研究では主に以下の2つのアプローチが提案されてきました。

  • LLMの事前知識を利用して、最終タスク目標を細かなサブタスクに分解
  • タスクの遂行中に、LLMの事前知識を引っ張り出して有効活用すること

しかし、前者のアプローチだと、環境要因の変化によって、解くべきサブタスクを調整することができず、柔軟性に欠けるという問題が発生します。また、後者のアプローチだと、事前知識から導かれる行動が、そもそも単純で体系的でないため、適切なアクションを起こせないという問題が発生します。

そのため、環境要因の変化に応じて、その都度最適なアプローチを模索しながら、柔軟にサブタスクを変更する必要があるのです。

そこで今回研究者らは、最終のタスク目標をツリー構造のサブゴールに分解し、エージェントのおかれた状況に応じて最も有用なサブゴールを特定しながら、ツリーを段階的に更新していく「SelfGoal」という手法を提案しています。

以下では、このSelfGoalについて詳しく解説します。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP