次回の更新記事:オープンモデルなのにClaudeなどに匹敵するとされる…(公開予定日:2026年06月25日)
AIDB Daily Papers

LLMのコード修正能力を反復フィードバックループで解き明かす

原題: Unlocking LLM Code Correction with Iterative Feedback Loops
著者: Le Zhang, Suresh Kothari
公開日: 2026-06-16 | 分野: LLM デバッグ コード生成 cs.AI cs.SE

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 本研究は、LLMが実行フィードバックを通じて自身のコードを修正する能力を体系的に調査した。
  • 実世界のプログラミング問題におけるLLMの反復的なコード修正プロセスを評価する新しいフレームワークと指標を導入した。
  • 推論能力を持つモデルは、非推論モデルよりもフィードバックを効果的に活用し、反復ごとに性能が向上することを発見した。

Abstract

Large Language Models have shown remarkable capabilities in code generation. However, most existing evaluations focus only on single-attempt accuracy and overlook the iterative refinement process that is central to real-world programming. This study presents a systematic investigation of LLMs' ability to rectify their own code through execution feedback. Using real-world programming problems across four models and two major programming languages, this study evaluates performance using iterative refinement framework where LLMs receive compiler error messages and testcase feedback after each attempt. This study introduces metrics to evaluate code failures, analyze rectification patterns, and compare the effectiveness of reasoning and non-reasoning models, offering actionable insights into both the understanding and practical application of feedback loops in LLM-driven code generation systems. Results show that reasoning models consistently improve over iterations, substantially outperforming non-reasoning models in leveraging feedback, while syntactic and runtime errors are far more tractable than logical or algorithmic failures.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事