AIDB
menu
AIDBとは
アカウント作成
ログイン
ホーム
過去の記事一覧
次回の更新記事:
既存のベンチマークテストは信頼できるのか?LLM評価…
(公開予定日:2025年02月20日)
コンテンツ検索
Search for:
LLM
政治・社会
論文
「LLM活用で文書作成」社会でどこまで導入されている
By AIDB Research
/ 2025/02/19
本記事では、LLMが社会のさまざまな分野...
Read More
LLM
論文
LLMを擬人化することに対する見解
By AIDB Research
/ 2025/02/18
本記事では、LLMを「人間らしいもの」と...
Read More
LLM
論文
LLM専用の「新しい言葉」を導入 Google DeepMind
By AIDB Research
/ 2025/02/17
本記事では、LLMの理解と制御に向けて新...
Read More
お知らせ
AIDBプレミアム会員特典のお知らせ
By AIDB Research
/ 2025/02/15
情報収集と学習を継続されている皆さまに対...
Read More
LLM
エージェント
論文
「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例
By AIDB Research
/ 2025/02/14
ソフトウェアを自然言語で操作する新しい手...
Read More
LLM
ベンチマーク
論文
天井が見え始めたこれまでのLLMベンチマークを超える究極の問題集 DeepSeek-R1もテスト
By AIDB Research
/ 2025/02/13
LLMの性能は日々進化を続けています。そ...
Read More
LLM
政治・社会
論文
「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査
By AIDB Research
/ 2025/02/12
これまで広い視野での「LLMによる仕事の...
Read More
クイズ
o3-miniクイズ
By AIDB Research
/ 2025/02/11
*前回はDeepSeekについてのクイズ...
Read More
LLM
オープンソース
推論モデル
論文
DeepSeek-R1の性能を検証 4つの主要LLMと比較
By AIDB Research
/ 2025/02/10
DeepSeek(DeepSeek-R1...
Read More
クイズ
DeepSeek‑R1クイズ
By AIDB Research
/ 2025/02/09
2025年1月20日に最新版「DeepS...
Read More
論文
2024/1/3
LLM
ハルシネーション
論文
LLMの内部状態を観察することで「出力がハルシネーションか否かを判別する」手法『LLMファクトスコープ』
LLMの内部状態を観察することで「出力がハルシネーションか否かを判別する」手法『LLMファクトスコープ』
2024/1/2
LLM
論文
Geminiの「常識を推論する能力」を網羅的に調査した結果 間違えやすいタイプの問題も明らかに
Geminiの「常識を推論する能力」を網羅的に調査した結果 間違えやすいタイプの問題も明らかに
2024/1/1
LLM
ファインチューニング
教育・キャリア
論文
人間のカリキュラム教育のような学習でLLMの性能は向上するとの報告
人間のカリキュラム教育のような学習でLLMの性能は向上するとの報告
2023/12/30
LLM
ベンチマーク
論文
AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満
AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満
2023/12/28
LLM
プロンプト
論文
プロンプトの原則26ヶ条をまとめた報告
プロンプトの原則26ヶ条をまとめた報告
2023/12/27
LLM
RAG
サーベイ
論文
LLMのRAG(外部知識検索による強化)をまとめた調査報告
LLMのRAG(外部知識検索による強化)をまとめた調査報告
2023/12/26
LLM
マルチモーダル
論文
Gemini Pro 対 GPT-4V、画像認識能力でどちらが優秀なのか
Gemini Pro 対 GPT-4V、画像認識能力でどちらが優秀なのか
2023/12/25
LLM
環境
論文
消費者向けGPUでも高性能GPUに近いパフォーマンスでLLMを動かす手法「PowerInfer」
消費者向けGPUでも高性能GPUに近いパフォーマンスでLLMを動かす手法「PowerInfer」
2023/12/23
LLM
ファインチューニング
政治・社会
論文
OpenAIが開発中の「人間を超えたAIを制御する」方法
OpenAIが開発中の「人間を超えたAIを制御する」方法
2023/12/21
LLM
論文
あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』
あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』
<
1
…
27
28
29
30
31
…
43
>
コンテンツ検索
検索:
57488
直近1ヶ月で読まれている記事
DeepSeek R1が実現した教師なし強化学習による推論性能の向上
LLM専用の「新しい言葉」を導入 Google DeepMind
GPT-4とヒューマノイドロボットを連携すると何が起こるか。東京大学と株式会社オルタナティヴ・マシンの研究者らが実験
LLMの定理証明力を2倍に向上させる「予想と証明を繰り返させる」手法 限られたデータの中で
「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査
PAGE TOP
Copyright ©
AIDB
All rights reserved.