LLMのRAG(外部知識検索による強化)についての調査結果が報告されています。
基本フレームワークと各構成要素(リトリーバー/ジェネレーター/拡張)の詳細、評価、そして今後の発展について言及されており網羅的です。
– “Retrieval-Augmented Generation for Large Language Models: A Survey”
以下は報告内容の抜粋です。
■RAGとは
① LLMが事前学習データに加えて外部のデータを取り入れて動くようにするための技術
② 社内データを参照させる際などにも使用される
③ プロンプトやファインチューニングと並ぶ選択肢
■構成要素
① リトリーバー(Retriever):
大規模なデータベースから、クエリに基づいて最も関連性の高い情報を見つけ出す役割を持つ
② ジェネレーター(Generator):
リトリーバーから提供された情報を基にして、自然言語の回答やテキストを生成する
③ 拡張(Augmentation):
リトリーバーとジェネレーターに追加的な情報や機能を提供する手段。(検索アルゴリズムの改善など)
■RAGの評価
① 正確性、情報更新速度、透明性などが主要な指標
② RAGASやARESなどの自動評価手法がある
■今後の発展
① さらなる最適化が必要
② 応用範囲の拡大が期待される
③ 技術スタックとエコシステムが発展すべき