ロングコンテキストはRAGもText to SQLも解決するか Googleがケーススタディを実施

ロングコンテキストのLLMは、単体でも多...
Read More

現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証

LLMが確率分布を理解し、確率推定を行う...
Read More

包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発

Metaなどの研究者らは、RAGシステム...
Read More

人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果

現実のユーザーからの難しいクエリを使用し...
Read More

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに

LLMは学習データに含まれる社会的な価値...
Read More

LLM

LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
マルチモーダルLLMでゼロショット画像分類の精度を向上させる手法 Googleが考案
難しいベンチマークで高性能なLLMでも単純な問題で間違えてしまう現象について「不思議の国のアリス問題」とGPT-4o、Claude-3、Llama 3などで分析
仮想の翻訳会社「TRANSAGENTS」に学ぶ マルチLLMエージェントによる効果的な翻訳システム
LLMの出力が信頼できるかを判定する手法 Google DeepMindが新しく考案
MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果
グラフニューラルネットワークを活用したRAG手法『GNN-RAG』 7BのLLMでも最先端性能
LLMで因果推論を行うためのプロンプト手法

業界/カテゴリー

PAGE TOP