Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:Oracleの決算から読み解くAI市場におけるクラウドビ…(公開予定日:2025年05月11日)

エージェント

生涯にわたりユーザーに寄り添いパーソナライズし続けるAIアシスタントの設計
LLMエージェントに人間のような欲求を持たせてシミュレーションする手法
実在する人間1052人の態度と行動をAIでモデル化 インタビューベースのエージェントが人間の回答を85%再現
LLMによるバグ全自動修正に成功するケースと失敗するケースの違い
Claude 3.5 Computer Useのケーススタディ集 示唆される「GUIエージェントの夜明け」
LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
計画のステップが増えるほど、LLMは最初の目標を見失っていく傾向がある
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
100万体のLLMエージェントによるシミュレーションを実験できる環境が登場
対話の中でユーザーの好みを学ぶ手法『CIPHER』 (プロンプトテンプレートあり)
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
LLMの「自己対話」により複雑な問題の解決能力を飛躍的に向上させる手法『Iteration of Thought』
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP