AIDB Daily Papers
CADプログラムをAIが自律生成:実データなしで100万件規模の解釈可能なCADデータセットを構築
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- AIエージェントがCAD環境内でコードを生成・実行・検証し、解釈可能なCADプログラムを自律合成するフレームワークを開発した。
- 実データが不足する中、LLMとフィードバックループを活用し、多様な操作を含む約100万件のCADプログラムを生成した点が重要である。
- 生成されたデータセットで学習したモデルは、複数視点画像からのCADプログラム再構築において既存手法を上回り、実データなしでの学習可能性を示した。
Abstract
Computer-Aided Design (CAD) models are defined by their construction history: a parametric recipe that encodes design intent. However, existing large-scale 3D datasets predominantly consist of boundary representations (B-Reps) or meshes, stripping away this critical procedural information. To address this scarcity, we introduce Zero-to-CAD, a scalable framework for synthesizing executable CAD construction sequences. We frame synthesis as an agentic search problem: by embedding a large language model (LLM) within a feedback-driven CAD environment, our system iteratively generates, executes, and validates code using tools and documentation lookup to promote geometric validity and operation diversity. This agentic approach enables the synthesis of approximately one million executable, readable, editable CAD sequences, covering a rich vocabulary of operations beyond sketch-and-extrude workflows. We also release a curated subset of 100,000 high-quality models selected for geometric diversity. To demonstrate the dataset's utility, we fine-tune a vision-language model on our synthetic data to reconstruct editable CAD programs from multi-view images, outperforming strong baselines, including GPT-5.2, and effectively bootstrapping sequence generation capabilities without real construction-history training data. Zero-to-CAD bridges the gap between geometric scale and parametric interpretability, offering a vital resource for the next generation of CAD AI.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: