AIDB Daily Papers
物語から実行可能な記述へ:一貫性を考慮したストーリーイラスト生成
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 物語全体を一貫性のある複数の画像に変換するため、新しいフレームワークS2EDを提案した。
- S2EDは、物語の分解、キャラクター属性の固定、空間・感情的要素の強化により、生成の一貫性を向上させる。
- 実験の結果、S2EDは既存手法と比較して、ストーリー全体の整合性とキャラクターの一貫性を大幅に改善した。
Abstract
Multi-frame story illustration requires long-horizon coherence beyond single-image text-to-image generation, including narrative decomposition and persistent character identity, layout, and affect across frames. We propose Story-to-Executable Descriptions (S2ED), a training-free, model-agnostic, prompt-layer framework that converts a full story into a sequence of explicit, editable executable descriptions for more consistent rendering. S2ED coordinates three agents to segment the narrative, ground canonical character attributes, and enrich spatial and affective cues, enabling interpretable prompt-carried state propagation and local edits to repair drift without retraining the generator. Experiments on Flintstones and Shakoo Maku show that S2ED improves sequence-level consistency and character fidelity over strong prompting, large-model planning, and a reference training-based method, under both automatic metrics and human judgments. We also deploy S2ED in an end-to-end story-to-storybook system for children's illustrated stories, with a supplementary video.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: