Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:LLMアプリケーション1,000事例から学ぶプロンプトテ…(公開予定日:2025年04月08日)

LLM

LLMを「評価者」として活用する『LLM-as-a-judge』の基本
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
LLMによるバグ全自動修正に成功するケースと失敗するケースの違い
LLMによる時系列データ分析に「ニュース情報」を混ぜるアプローチ 為替予測精度など大幅に向上
Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」
LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証
LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容
画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど
Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
LLMの機能別「領域」はまるで脳のようであるとの仮説

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP