AIDB
menu
AIDBとは
AI用語集
AI問題集
文献調査サービス
アカウント作成
ログイン
サイトQ&A
ホーム
過去の記事一覧
コンテンツ検索
Search for:
LLM
エージェント
論文
Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」
By AIDB Research
/ 2024/11/21
本記事では、PCの画面を見て操作できる「...
Read More
LLM
論文
LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証
By AIDB Research
/ 2024/11/20
本記事では、LLMが「答えに自信がない時...
Read More
LLM
エージェント
論文
LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
By AIDB Research
/ 2024/11/19
本記事では、LLMエージェントを安全に開...
Read More
LLM
オープンソース
論文
オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容
By AIDB Research
/ 2024/11/18
本記事では、コード生成に特化したLLM「...
Read More
LLM
RAG
論文
画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど
By AIDB Research
/ 2024/11/15
本記事では、複数の文書やページから図や表...
Read More
LLM
オープンソース
論文
Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
By AIDB Research
/ 2024/11/14
本記事では、LLMの推論コストを削減する...
Read More
LLM
論文
LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける
By AIDB Research
/ 2024/11/13
本記事では、LLMの長文処理能力について...
Read More
LLM
エージェント
論文
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
By AIDB Research
/ 2024/11/12
本記事では、マイクロソフトが開発したマル...
Read More
LLM
RAG
論文
「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
By AIDB Research
/ 2024/11/11
本記事では、LLMの精度向上のために用い...
Read More
LLM
論文
LLMの機能別「領域」はまるで脳のようであるとの仮説
By AIDB Research
/ 2024/11/08
本記事では、LLMの内部で発見された驚く...
Read More
論文
2024/9/2
LLM
エージェント
論文
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功
2024/8/30
LLM
エージェント
論文
「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績
「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績
2024/8/29
LLM
RAG
論文
RAGで検索文書の要約を活用したクエリ書き換えが検索精度を大幅に向上させる AWS報告
RAGで検索文書の要約を活用したクエリ書き換えが検索精度を大幅に向上させる AWS報告
2024/8/28
LLM
エージェント
論文
人間を討論で言い負かすディベート上手なLLMの実装
人間を討論で言い負かすディベート上手なLLMの実装
2024/8/27
LLM
プロンプト
論文
プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
2024/8/26
LLM
ハルシネーション
論文
モデルとデータの大規模化で変化するLLMのハルシネーション Google DeepMindの研究
モデルとデータの大規模化で変化するLLMのハルシネーション Google DeepMindの研究
2024/8/23
LLM
エージェント
セキュリティ
論文
LLMにおける現状のリスクと対策に関するまとめ
LLMにおける現状のリスクと対策に関するまとめ
2024/8/22
LLM
エージェント
セキュリティ
論文
LLMのサイバーセキュリティタスク性能評価フレームワーク「Cybench」
LLMのサイバーセキュリティタスク性能評価フレームワーク「Cybench」
<
1
…
6
7
8
9
10
…
46
>
コンテンツ検索
検索:
83023
直近1ヶ月で読まれている記事
「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
LLMが自分で「より賢いLLMの作り方」を発見するSelf-Developingフレームワーク(NEC 石橋陽一氏)
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
o1モデルが人間のように6つの思考パターンを使い分けているとの実験結果
PAGE TOP
Copyright ©
AIDB
All rights reserved.