次回の更新記事:誤解を招きやすいAI用語6選、技術語なのに揺れる意味(公開予定日:2026年04月30日)
AIDB Daily Papers

LLMによる製品ライン早期検証:半形式的ブループリント分析の研究

原題: Early-Stage Product Line Validation Using LLMs: A Study on Semi-Formal Blueprint Analysis
著者: Viet-Man Le, Thi Ngoc Trang Tran, Sebastian Lubos, Alexander Felfernig, Damian Garber
公開日: 2026-04-22 | 分野: LLM 検証 分析 ソフトウェアエンジニアリング cs.AI cs.SE

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 本研究では、LLMが半形式的なテキストブループリント上で直接、機能モデル分析操作を実行できるかを検証した。
  • 推論最適化LLMは、ソルバーベースの正解率に迫る88-89%の平均精度を達成し、早期検証の可能性を示した。
  • 構造解析や制約推論における系統的なエラーを特定し、LLMを早期のバリアビリティ検証用軽量アシスタントとして位置づけた。

Abstract

We study whether Large Language Models (LLMs) can perform feature model analysis operations (AOs) directly on semi-formal textual blueprints, i.e., concise constrained-language descriptions of feature hierarchies and constraints, enabling early validation in Software Product Line scoping. Using 12 state-of-the-art LLMs and 16 standard AOs, we compare their outputs against the solver-based oracle FLAMA. Results show that reasoning-optimized models (e.g., Grok 4 Fast Reasoning, Gemini 2.5 Pro) achieve 88-89% average accuracy across all evaluated blueprints and operations, approaching solver correctness. We identify systematic errors in structural parsing and constraint reasoning, and highlight accuracy-cost trade-offs that inform model selection. These findings position LLMs as lightweight assistants for early variability validation.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事