Search for:
menu
menu
論文
AIDBとは
アカウント作成
ログイン
ホーム
過去の記事一覧
次回の更新記事:
会議出席代行システム LLMでどこまでできるか
(公開予定日:2025年02月25日)
LLM
2024/6/17
LLM
サーベイ
プロンプト
論文
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
2024/6/14
LLM
RAG
ベンチマーク
論文
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発
2024/6/13
LLM
論文
人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果
人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果
2024/6/12
LLM
政治・社会
論文
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
2024/6/11
LLM
マルチモーダル
論文
マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告
マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告
2024/6/10
LLM
論文
難しいベンチマークで高性能なLLMでも単純な問題で間違えてしまう現象について「不思議の国のアリス問題」とGPT-4o、Claude-3、Llama 3などで分析
難しいベンチマークで高性能なLLMでも単純な問題で間違えてしまう現象について「不思議の国のアリス問題」とGPT-4o、Claude-3、Llama 3などで分析
2024/6/7
LLM
エージェント
論文
仮想の翻訳会社「TRANSAGENTS」に学ぶ マルチLLMエージェントによる効果的な翻訳システム
仮想の翻訳会社「TRANSAGENTS」に学ぶ マルチLLMエージェントによる効果的な翻訳システム
2024/6/6
LLM
論文
LLMの出力が信頼できるかを判定する手法 Google DeepMindが新しく考案
LLMの出力が信頼できるかを判定する手法 Google DeepMindが新しく考案
2024/6/5
LLM
ベンチマーク
論文
MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果
MMLUをアップデートしたベンチマーク『MMLU-Pro』Phi-3やLlama 3、Claude 3、GPT-4oなどの評価結果
2024/6/4
LLM
RAG
論文
グラフニューラルネットワークを活用したRAG手法『GNN-RAG』 7BのLLMでも最先端性能
グラフニューラルネットワークを活用したRAG手法『GNN-RAG』 7BのLLMでも最先端性能
<
1
…
16
17
18
19
20
…
43
>
直近1ヶ月で読まれている記事
LLM専用の「新しい言葉」を導入 Google DeepMind
GPT-4とヒューマノイドロボットを連携すると何が起こるか。東京大学と株式会社オルタナティヴ・マシンの研究者らが実験
LLMの定理証明力を2倍に向上させる「予想と証明を繰り返させる」手法 限られたデータの中で
「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査
LLMを擬人化することに対する見解
プロフィールを登録すると
仕事のオファーが届きます
プロフィール登録
PAGE TOP
Copyright ©
AIDB
All rights reserved.