LLMの出力から誤り（ハルシネーション）を減らす新手法『CoVe（Chain-of-Verification）』と実行プロンプト

■無料で入れる新コミュニティ発足のお知らせ

---以下、記事本文---

LLMの出力から誤り（ハルシネーション）を減らす新手法『CoVe（Chain-of-Verification）』と実行プロンプト

大規模言語モデルにおけるハルシネーション（事実とは異なる誤った出力）を有意に減少させることができる手法Chain-of-Verification（CoVe）手法が発表されました。

この手法は、Wikidataに基づいたリストベースの質問、長文のテキスト生成といった多様なタスクで効果を発揮しました。

本記事は論文を参照し、『CoVe』の性能や、具体的なプロンプト例などを紹介します。

参照論文情報

タイトル：Chain-of-Verification Reduces Hallucination in Large Language Models

著者：Shehzaad Dhuliawala, Mojtaba Komeili, Jing Xu, Roberta Raileanu, Xian Li, Asli Celikyilmaz, Jason Weston

機関：Meta AI, ETH Zurich

URL：https://doi.org/10.48550/arXiv.2309.11495

https://twitter.com/ai_database/status/1705071910885941683

「LLMの推論能力を向上させる手法」に関連する他の研究

推論能力をさらに強める戦略『AoT』で、LLMが「直感」に似た能力を示すようになった

タスクに応じてロールプレイさせるとChatGPTなどLLMの推論能力は普遍的に向上する

LLMに自身のハルシネーション（幻覚）を「自覚」させ、減らす方法

従来の課題

大規模言語モデルは、しばしば「ハルシネーション」と呼ばれる現象を引き起こします。ハルシネーションとは、モデルが「事実に基づかないが一見妥当に見える情報」を生成することを指します。訓練データに少なく出現する事実に対して、モデルは誤った情報を生成する傾向があります。

ハルシネーションが問題とされるのは、例えば質問応答システムで正確な情報を提供する必要がある場合や、自動要約で信頼性が求められる場合などです。

Chain-of-Verification（CoVe）の主なアイデア

今回Meta AIが発表した『CoVe』は、大規模な言語モデルが生成する回答の信頼性を高めるためのフレームワークです。モデルは初めに回答のドラフトを生成し、その後でその回答が事実に基づいているかどうかを検証するための質問を計画します。次に、それらの質問に独立して回答し、最終的な検証済みの回答を生成します。