短信
論文
スキル
クリップ
プロンプト
お知らせ
会員作成
ログイン
AIDBについて
次回の更新記事:
AIエージェントの「スキルマーケット」を大規模調査…
(公開予定日:2026年02月21日)
スタッフ
HOME
スタッフ
AIDB Researchの記事一覧
深堀り解説
手法
🔒 『LLM-as-a-judge』のさまざまな応用と分野の展望
2024.11.29
2026.02.07
クリップする
深堀り解説
手法
🔒 LLMを「評価者」として活用する『LLM-as-a-judge』の基本
2024.11.28
2026.02.07
クリップする
深堀り解説
手法
🔒 OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
2024.11.27
2025.12.22
クリップする
深堀り解説
手法
🔒 Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
2024.11.26
2025.12.22
クリップする
深堀り解説
手法
🔒 LLMによるバグ全自動修正に成功するケースと失敗するケースの違い
2024.11.25
2025.12.22
クリップする
深堀り解説
手法
🔒 LLMによる時系列データ分析に「ニュース情報」を混ぜるアプローチ 為替予測精度など大幅に向上
2024.11.22
2025.07.28
クリップする
深堀り解説
手法
🔒 Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」
2024.11.21
2025.12.22
クリップする
深堀り解説
手法
🔒 LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証
2024.11.20
2025.08.28
クリップする
深堀り解説
手法
🔒 LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
2024.11.19
2025.12.22
クリップする
深堀り解説
手法
🔒 オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容
2024.11.18
2025.04.27
クリップする
深堀り解説
手法
🔒 画像も文字も表も全部まとめて理解するRAGシステムの提案
2024.11.15
2025.12.22
クリップする
深堀り解説
手法
🔒 Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持
2024.11.14
2025.12.22
クリップする
深堀り解説
手法
🔒 LLMにおける長文処理能力の進化を調査 Claudeは情報の流れを追跡するスキルに長ける
2024.11.13
2025.12.22
クリップする
深堀り解説
手法
🔒 上司役のLLMが部下LLMたちに的確に仕事を振り分けるフレームワーク
2024.11.12
2025.12.22
クリップする
深堀り解説
手法
🔒 「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
2024.11.11
2025.12.22
クリップする
深堀り解説
分析
🔒 LLMの機能別「領域」はまるで脳のようであるとの仮説
2024.11.08
2025.12.22
クリップする
深堀り解説
分析
🔒 直感に頼るようなタスクだとLLMに「ステップバイステップで考えて」は逆効果
2024.11.07
2025.12.22
クリップする
深堀り解説
分析
🔒 LLMの「知っているのに嘘をつく」幻覚と「知らないから間違える」幻覚の違い
2024.11.06
2025.12.22
クリップする
深堀り解説
手法
🔒 OpenAIが新しくLLMの事実性評価ベンチマーク『SimpleQA』をリリース 実用に役立つ知見も得られる
2024.11.05
2025.12.22
クリップする
深堀り解説
手法
LLMが自分で「より賢いLLMの作り方」を発見するSelf-Developingフレームワーク(NEC 石橋陽一氏)
2024.11.04
2025.04.05
クリップする
投稿のページ送り
1
…
19
20
21
…
40
新着AI論文記事一覧
サイト概要
プレミアム会員規約
運営会社
お問い合わせ
よくある質問
Copyright © Parks, Inc. All rights reserved.
短信
論文
スキル
クリップ
プロンプト
お知らせ
会員作成
ログイン
AIDBについて