次回の更新記事:誤解を招きやすいAI用語6選、技術語なのに揺れる意味(公開予定日:2026年04月30日)
AIDB Daily Papers

無限問題生成器:エージェント型ワークフローによる物理推論データの実証的スケーリング

原題: Infinite Problem Generator: Verifiably Scaling Physics Reasoning Data with Agentic Workflows
著者: Aditya Sharan, Sriram Hebbale, Dhruv Kumar
公開日: 2026-03-15 | 分野: 教育AI データセット 推論 機械学習 AI 知識 科学 Python 数理モデル 生成 コード 物理

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 物理の問題を解くAIモデルの学習データ不足を解消するため、解が保証された問題を自動生成するフレームワークIPGを開発しました。
  • IPGは数式をPythonコードとして扱い、厳密な数学的整合性を担保することで、従来のテキスト生成に伴う誤りを防ぎます。
  • 古典力学の問題を1335件生成した結果、問題の複雑さとコードの長さには強い相関があり、難易度制御が可能であることが示されました。

Abstract

Training large language models for complex reasoning is bottlenecked by the scarcity of verifiable, high-quality data. In domains like physics, standard text augmentation often introduces hallucinations, while static benchmarks lack the reasoning traces required for fine-tuning. We introduce the Infinite Problem Generator (IPG), an agentic framework that synthesizes physics problems with guaranteed solvability through a Formula-as-Code paradigm. Unlike probabilistic text generation, IPG constructs solutions as executable Python programs, enforcing strict mathematical consistency. As a proof-of-concept, we release ClassicalMechanicsV1, a high-fidelity corpus of 1,335 classical mechanics problems expanded from 165 expert seeds. The corpus demonstrates high structural diversity, spanning 102 unique physical formulas with an average complexity of 3.05 formulas per problem. Furthermore, we identify a Complexity Blueprint, demonstrating a strong linear correlation ($R^2 approx 0.95$) between formula count and verification code length. This relationship establishes code complexity as a precise, proxy-free metric for problem difficulty, enabling controllable curriculum generation. We release the full IPG pipeline, the ClassicalMechanicsV1 dataset, and our evaluation report to support reproducible research in reasoning-intensive domains.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事