LLM向けRAGサーベイ：構成要素/評価/発展を網羅

2023.12.24

RAG・検索（検索拡張生成、知識ベース、ベクトル検索）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

LLMのRAG（外部知識検索による強化）についての調査結果が報告されています。

基本フレームワークと各構成要素（リトリーバー／ジェネレーター／拡張）の詳細、評価、そして今後の発展について言及されており網羅的です。

– “Retrieval-Augmented Generation for Large Language Models: A Survey”

以下は報告内容の抜粋です。

■RAGとは

① LLMが事前学習データに加えて外部のデータを取り入れて動くようにするための技術
② 社内データを参照させる際などにも使用される
③ プロンプトやファインチューニングと並ぶ選択肢

■構成要素

① リトリーバー（Retriever）：
大規模なデータベースから、クエリに基づいて最も関連性の高い情報を見つけ出す役割を持つ

② ジェネレーター（Generator）：
リトリーバーから提供された情報を基にして、自然言語の回答やテキストを生成する

③ 拡張（Augmentation）：
リトリーバーとジェネレーターに追加的な情報や機能を提供する手段。（検索アルゴリズムの改善など）

■RAGの評価

① 正確性、情報更新速度、透明性などが主要な指標
② RAGASやARESなどの自動評価手法がある

■今後の発展

① さらなる最適化が必要
② 応用範囲の拡大が期待される
③ 技術スタックとエコシステムが発展すべき

■論文情報

📎 論文を読む（arxiv.org）

こちらもどうぞ