
RAGは、エンタープライズのナレッジベース検索で標準構成として定着しました。クエリをベクトル化して近い文章を拾い、断片だけをLLMに渡す。この枠組みで、多くの業務が回っています。
ただ、この構成にはLLMがコーパス全体を俯瞰できないという構造的な限界があります。拾えなかった領域に答えがあっても、AIには確かめる術がありません。複数のトピックにまたがる質問ほど、この視野の狭さが精度に直結します。
そこで、RAGの設計そのものを問い直す提案が現れました。検索を前提としない方向へ、発想を切り替える試みです。従来のRAGとどう違うのか。実際の実験ではどんな結果になったのか。詳しく見ていきます。