深堀り解説実証 🔒 LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack(干し草の中の針)」テスト結果とプロンプト例 2024.04.222025.03.08 クリップする
深堀り解説実証 🔒 プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか?DeepMindによる『Many-shot Learning』の実験結果 2024.04.192025.03.08 クリップする
深堀り解説手法 🔒 LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発 2024.04.012025.03.08 クリップする