次回の更新記事:今週の注目AI論文リスト(論文公開日2026/2/1~2/7)(公開予定日:2026年02月08日)
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

LLMの自己反省を促すSelf-Contrastアプローチ

推論・思考(論理推論、Chain-of-Thought、数学的推論、問題解決)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMに多面的な思考の観点から複数の解答を生成させ、自ら比較して最適な答えを導かせるアプローチ『Self-Contrast』がプロンプト例とともに公開されています。

平たく言えば自ら反省してより良い行動をとらせる手法です。

“Self-Contrast: Better Reflection Through Inconsistent Solving Perspectives”より

LLMの反省能力は、外部フィードバックなしでは過信などが原因で不安定だと言われています。
今回、異なる解答を比較して反省を促すアプローチが考案されました。

■プロンプトテンプレート例
※論文をもとに日本語で簡略化しています。
1. あなたは多様な視点から問題を解決するスペシャリストです。問題に対して、多面的な思考(論理的思考、水平思考、類推的思考など)、異なる推論の視点(トップダウン、ボトムアップ、ステップバイステップなど)、異なる関心の重点(実体語、数値、単位、パーセンテージ、数学の知識など)を使用して複数の解答を作成してください。
2. 各解の解決ステップの違いを丁寧に比較してください。比較する際は、以下の点を考慮してください:
– 最終的な答えと数式が異なるか?
– 解決ステップと数式の違いはどこにあるか?
– なぜ答えが異なるのか?
3. 解の不一致の背後にある理由を慎重に検討し、解決策の修正を行なってください。

■実験結果
– 標準的な反省手法と比べ、数学的推論や翻訳タスクで向上を示した
– GPT-3.5/4やLlama2ファミリーで良好な結果を達成した
– マルチエージェントやアンサンブルと比較しても匹敵する戦略だった

📄 参照論文

論文情報

関連記事