AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(1,103件) 短信(804件) 🔒 論文(54,859件) 🔒

RAGシステムに「無関係な」文書を混ぜたほうがLLMの出力精度が上がる可能性が示唆された

2024.02.012025.12.28

深堀り解説

「無関係な」文書を混ぜたほうが出力精度が上がる可能性がRAGシステムの検証で示唆されました。

これまでになかった視点だと述べられています。

通常RAGシステムではRetrieverによってタスクに関係する文書を取り出してLLMにコンテキストとして与えるのが一般的です。しかし今回の実験では、あえて無関係な文書も「ノイズ」として乗せる実験を行なっています。

参照論文情報

タイトル：The Power of Noise: Redefining Retrieval for RAG Systems

著者：Florin Cuconasu, Giovanni Trappolini, Federico Siciliano, Simone Filice, Cesare Campagnano, Yoelle Maarek, Nicola Tonellotto, Fabrizio Silvestri

所属：Sapienza University of Rom, Technology Innovation Institute, University of Pisa

LLMとRAG

LLMは、長い文章や複雑な質問への対応にはまだ課題があると言われています。そこで注目されているのが、LLMと情報検索技術を融合したRAGシステムです。
RAGシステムは、LLMに情報を提供することで、より正確で文脈に沿ったテキスト生成を実現するものです。主に以下2つのコンポーネントから構成されます。

・Retriever：外部情報源からクエリに関連する情報を検索します。

・Generator：Retrieverから得られた情報に基づいて、文脈に沿ったテキストを生成します。今回はLLMのことを指します。

今回紹介する論文では、研究者らがLLMにおけるRAGシステムの新しい知見を得たことが報告されています。
結論から紹介すると、以下のことが分かりました。

1. 検索フェーズにおいて関連文書の追加は必ずしも有益とは限らない
2. コンテキストにノイズを含めることが精度向上に貢献する

この結論は、RAGシステム特有の情報処理メカニズムが従来の情報検索とは異なることを示唆するものです。
実験内容に詳しく触れる前に、LLMの発展の経緯やRAGの登場について少しおさらいします。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
AI検索（公開記事が対象）
PDF翻訳・パーソナライズなど各機能のお試し利用

プレミアム会員の特典

1,000本以上の全過去記事を無制限閲覧
論文ベースの深掘り解説を毎日更新で購読
AI検索の対象が短信・論文（5万本以上）まで拡大
記事で取り上げた論文にその場でAIに質問
論文から生まれたエージェントスキルライブラリ
PDF翻訳・PDF変換をフル活用
あなた専用の論文・記事おすすめが毎日届く

まずはアカウントを作成

ログイン

プレミアム会員について

RAGシステムに「無関係な」文書を混ぜたほうがLLMの出力精度が上がる可能性が示唆された

LLMとRAG

記事検索

こちらもどうぞ

🔒 OpenAIが提唱する「AIエージェントの管理法」

🔒 実在する人間1052人の態度と行動をAIでモデル化　インタビューベースのエージェントが人間の回答を85%再現

LLMとRAG

記事検索

こちらもどうぞ

🔒 OpenAIが提唱する「AIエージェントの管理法」

🔒 実在する人間1052人の態度と行動をAIでモデル化 インタビューベースのエージェントが人間の回答を85%再現

🔒 実在する人間1052人の態度と行動をAIでモデル化　インタビューベースのエージェントが人間の回答を85%再現