AIDB Daily Papers
AIエージェントがソフトウェア開発ライフサイクルを革新:アーキテクチャ、実証、そしてソフトウェア工学の再定義
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 大規模言語モデル(LLM)の進化により、AIエージェントがコード補完からリポジトリ全体を管理するレベルへとソフトウェア開発を変革した。
- 本研究は、AIエージェントのための6層アーキテクチャと新たな開発ライフサイクル(A-SDLC)を提案し、その重要性と新規性を示している。
- AIエージェントは、SWE-benchの正答率を大幅に向上させ、開発時間を短縮し、労働市場にも影響を与えているという実証結果が得られた。
Abstract
The arrival of large language models (LLMs) capable of multi-step reasoning, tool use, and long-horizon planning has produced a qualitative shift in software engineering. Where earlier code-completion tools such as GitHub Copilot operated at the granularity of a line or function, modern agentic systems -- Claude Code, OpenAI Codex CLI, Google Jules, Devin, OpenHands, SWE-agent, MetaGPT, ChatDev, and DeepMind's AlphaEvolve -- operate at the granularity of a repository, a feature, or an algorithm. We synthesize work from Anthropic, OpenAI, Google DeepMind, Microsoft Research, Princeton, Stanford, and the broader academic community to characterize this transition. We propose a six-layer reference architecture for agentic software engineering systems, contrast a traditional Software Development Lifecycle (SDLC) with an emerging Agentic SDLC (A-SDLC), and consolidate empirical evidence on performance (a rise from 1.96% to 78.4% on SWE-bench Verified between October 2023 and April 2026), productivity (13.6%-55.8% time savings across controlled studies), and labor-market impact (49% of jobs sampled by Anthropic in 2026 saw AI used for at least a quarter of their tasks). We argue that the central object of inquiry has shifted from code generation to delegated execution under human supervision, and we identify five open problems -- evaluation, governance, technical debt, skill redistribution, and the economics of attention -- that will determine whether the agentic transition is net-positive for the discipline.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: