要約品質を高めるChain of Densityプロンプト

2023.09.16

プロンプト（プロンプトエンジニアリング、few-shot、in-context learning）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

要約タスクの能力を向上させるプロンプトフレームワーク『Chain of Density (CoD)プロンプト』を、SalesforceやMITなどの研究グループが発表しました。

⚪︎ Griffin Adams et al. “From Sparse to Dense:GPT-4 Summarization with Chain of Density Prompting”

■フレームワーク概要
大枠は以下の二段階です。
① 複数回に渡って要約を作る
② だんだん「密度を濃く」する

■「密度を濃く」する方法
本文の主要なストーリーに含まれている要素が、すでに出力された要約には含まれていない場合、それらを幾つか追加する。

■具体的なプロンプトテンプレート
“Write a VERY short summary of the Article. Do not exceed 70 words.”

論文ではこの最初のプロンプトのみ提案されていますが、その先のプロンプトは以下のように考案できます。

“Review the initial summary and add 1-3 salient entities that were missing, without increasing the word count beyond 70 words.”

“Enhance the previous summary by incorporating 1-3 new details from the article, maintaining a maximum of 70 words.”

これらのプロンプトを日本語に直して使用するか、あるいは出力された要約が英語であればその後に翻訳をかけることで、日本語にも対応できます。

■実験結果

人間による評価では、CoDステップにおける3段階目の要約が最も好まれ、これは人間が書いた要約と非常に類似したエンティティ密度を持っていますと考えられます。
※エンティティとは、特定の情報や概念を指す単語やフレーズのことです。

From Sparse to Dense: GPT-4 Summarization with Chain of Density Prompting

著者: 著者：Griffin Adams, Alexander Fabbri, Faisal Ladhak, Eric Lehman, Noémie Elhadad

こちらもどうぞ