次回の更新記事:GPT-5などの高性能LLMは実際に稼げるのか?実案件で…(公開予定日:2025年11月28日)

投稿者の過去記事

実在する人間1052人の態度と行動をAIでモデル化 インタビューベースのエージェントが人間の回答を85%再現
テキストだけでなく画像・動画生成もこなすAmazon Novaモデルファミリー 高性能で高速
実際の企業データからなるtext-to-SQLベンチマーク「Spider 2.0」と専門エージェント『Spider-Agent』
時系列データをグラフにしてLLMに見せると文字だけより最大120%性能向上 トークンも節約
長文コンテキスト処理はRAGを進化させるのか?最新モデル20種類での実験結果
『LLM-as-a-judge』のさまざまな応用と分野の展望
LLMを「評価者」として活用する『LLM-as-a-judge』の基本
OpenAIのo1モデルへの対抗馬 アリババが独自の推論モデル「Marco-o1」を開発 オープンソースで公開
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
LLMによるバグ全自動修正に成功するケースと失敗するケースの違い
LLMによる時系列データ分析に「ニュース情報」を混ぜるアプローチ 為替予測精度など大幅に向上
Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」
LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証
LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP