次回の更新記事:誤解を招きやすいAI用語6選、技術語なのに揺れる意味(公開予定日:2026年04月30日)
AIDB Daily Papers

安全かつスケーラブルなWebエージェント学習:再現されたウェブサイトを活用

原題: Safe and Scalable Web Agent Learning via Recreated Websites
著者: Hyungjoo Chae, Jungsoo Park, Alan Ritter
公開日: 2026-03-11 | 分野: 安全性 機械学習 AI エージェント 言語 自動化 Python ウェブ

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 言語モデルを環境クリエイターとして活用し、現実世界のウェブサイトをクローンした安全な合成環境を自動生成するVeriEnvを提案。
  • VeriEnvはPython SDKを通じて制御された内部アクセスを提供し、エージェントが自己生成タスクを実行し、プログラムで検証可能な報酬を得ることを可能にする。
  • VeriEnvで訓練されたエージェントは、未知のウェブサイトへの汎化、自己進化型訓練によるサイト固有の習熟、訓練環境数のスケーリングの恩恵を受けることを実験で示した。

Abstract

Training autonomous web agents is fundamentally limited by the environments they learn from: real-world websites are unsafe to explore, hard to reset, and rarely provide verifiable feedback. We propose VeriEnv, a framework that treats language models as environment creators, automatically cloning real-world websites into fully executable, verifiable synthetic environments. By exposing controlled internal access via a Python SDK, VeriEnv enables agents to self-generate tasks with deterministic, programmatically verifiable rewards, eliminating reliance on heuristic or LLM-based judges. This design decouples agent learning from unsafe real-world interaction while enabling scalable self-evolution through environment expansion. Through experiments on web agent benchmarks, we show that agents trained with VeriEnv generalize to unseen websites, achieve site-specific mastery through self-evolving training, and benefit from scaling the number of training environments. Code and resources will be released at https://github.com/kyle8581/VeriEnv upon acceptance.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事