AIDB Daily Papers
MangaFlow:物語からマンガ生成までをエンドツーエンドで制御するエージェントフレームワーク
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 物語の分解、キャラクター・シーンの固定、ページレイアウト設計などをエージェントで分解し、マンガ生成を制御するフレームワークを提案した。
- 既存手法の課題であるレイアウトや視覚的参照、パネル間の一貫性の制御を、中間変数として明示的に扱うことで解決した。
- レイアウト追従性やパネル間の一貫性が向上し、柔軟な人間による制御をサポートする結果が得られた。
Abstract
End-to-end manga generation is a structured visual storytelling task that requires story decomposition, recurring character and scene grounding, page layout design, panel rendering, page composition, and lettering. However, existing generative models often perform direct page synthesis, entangling these factors in a single visual output and limiting precise control over layout geometry, visual references, and cross-panel consistency. To address these limitations, we propose MangaFlow, an agentic framework for controllable long-form manga generation that decomposes manga creation into planning, grounding, layout construction, reference-conditioned rendering, composition, and text placement. By treating layout and visual references as explicit intermediate variables, MangaFlow enables both simple text-to-manga generation and more precise user-controlled manga creation. This design exposes layout, visual assets, and lettering as editable intermediate controls for refining panel geometry, references, and text placement. To support long-form consistency, MangaFlow introduces a story section memory that links section descriptions with corresponding character, scene, and object references for reuse across panels. We further present a meta-benchmark for evaluating layout controllability, visual consistency, and generation quality. Experiments show that MangaFlow improves layout adherence and cross-panel consistency over direct generation baselines while supporting flexible human control.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: