次回の更新記事:推論時のトークン数を80%以上削減しながら出力精度を…(公開予定日:2025年03月17日)

記事スタイル

実際の企業データからなるtext-to-SQLベンチマーク「Spider 2.0」と専門エージェント『Spider-Agent』
時系列データをグラフにしてLLMに見せると文字だけより最大120%性能向上 トークンも節約
長文コンテキスト処理はRAGを進化させるのか?最新モデル20種類での実験結果
『LLM-as-a-judge』のさまざまな応用と分野の展望
LLMを「評価者」として活用する『LLM-as-a-judge』の基本
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
LLMによるバグ全自動修正に成功するケースと失敗するケースの違い
LLMによる時系列データ分析に「ニュース情報」を混ぜるアプローチ 為替予測精度など大幅に向上
Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP