AIDB Daily Papers
創造的品質アラインメント:思考連鎖ファインチューニングによる専門家の暗黙知移転
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 専門家の思考連鎖アノテーションを基に、創造的品質を評価する手法を工学的に実装した。
- 既存のデータセットの偏りを是正し、少量のデータと小型モデルで効果的なアラインメントを実現する。
- 評価側のアラインメントが生成側へ自動的に移転する構造的理由を理論的に示し、少数の例で十分であることを実証した。
Abstract
This paper provides an empirical implementation of the creative quality metric proposed in Calibrated Surprise (Zou & Xu, 2026a). The question this paper addresses is: does this mathematical claim hold at the engineering level? To make the answer as general as possible, we deliberately choose the strictest engineering conditions: low data cost and a small base model. Training data comes from approximately 100 expert chain-of-thought (CoT) annotations produced by the BC Protocol (Zou & Xu, 2026b). We also identify a data bias: most publicly available alignment datasets are skewed toward craft-related knowledge, while audience modeling and reality-logic coverage are systematically weak. We use the term Creative Quality Alignment (CQA) to describe this class of engineering methods. We also offer a supporting theoretical observation: in an LLM with a single conditional distribution architecture, calibrating the appreciation side automatically transfers to the generation side via architectural duality. This is the structural reason why ~100 CoT examples are sufficient -- not a purely empirical observation like LIMA (Zhou et al., 2023).
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: