LLMの自己反省を促すSelf-Contrastアプローチ

2024.03.29

推論・思考（論理推論、Chain-of-Thought、数学的推論、問題解決）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMに多面的な思考の観点から複数の解答を生成させ、自ら比較して最適な答えを導かせるアプローチ『Self-Contrast』がプロンプト例とともに公開されています。

平たく言えば自ら反省してより良い行動をとらせる手法です。

“Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives”より

LLMの反省能力は、外部フィードバックなしでは過信などが原因で不安定だと言われています。
今回、異なる解答を比較して反省を促すアプローチが考案されました。

■プロンプトテンプレート例
※論文をもとに日本語で簡略化しています。
1. あなたは多様な視点から問題を解決するスペシャリストです。問題に対して、多面的な思考(論理的思考、水平思考、類推的思考など)、異なる推論の視点(トップダウン、ボトムアップ、ステップバイステップなど)、異なる関心の重点(実体語、数値、単位、パーセンテージ、数学の知識など)を使用して複数の解答を作成してください。
2. 各解の解決ステップの違いを丁寧に比較してください。比較する際は、以下の点を考慮してください:
– 最終的な答えと数式が異なるか?
– 解決ステップと数式の違いはどこにあるか?
– なぜ答えが異なるのか?
3. 解の不一致の背後にある理由を慎重に検討し、解決策の修正を行なってください。

■実験結果
– 標準的な反省手法と比べ、数学的推論や翻訳タスクで向上を示した
– GPT-3.5/4やLlama2ファミリーで良好な結果を達成した
– マルチエージェントやアンサンブルと比較しても匹敵する戦略だった

📄 参照論文

論文情報

📎 論文を読む（doi.org）

X（Twitter）で見る

LLMの自己反省を促すSelf-Contrastアプローチ

📄 参照論文

関連記事

🔒 プロンプトが科学である理由と探求の心構え

🔒 ユーザーの指示が曖昧なとき、LLM側が確認を行うエージェントアーキテクチャ『Mistral-Interact』

🔒 ビジネスプロセス評価におけるLLMの使いどころ

🔒 オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents（MoA）」アーキテクチャ

🔒 Claude 3のベンチマーク評価結果　論文（テクニカルレポート）より

AIの理解力を問い直す　責任から共感まで広がる最前線

📄 参照論文

関連記事

🔒 プロンプトが科学である理由と探求の心構え

🔒 ユーザーの指示が曖昧なとき、LLM側が確認を行うエージェントアーキテクチャ『Mistral-Interact』

🔒 ビジネスプロセス評価におけるLLMの使いどころ

🔒 オープンソースモデルでも力を合わせれば先端モデルに匹敵することを示す「Mixture-of-Agents（MoA）」アーキテクチャ

🔒 Claude 3のベンチマーク評価結果 論文（テクニカルレポート）より

AIの理解力を問い直す 責任から共感まで広がる最前線

🔒 Claude 3のベンチマーク評価結果　論文（テクニカルレポート）より

AIの理解力を問い直す　責任から共感まで広がる最前線