次回の更新記事:企業環境での自動バグ修復に向けたGoogleの取り組み(公開予定日:2025年01月21日)

Web3向けLLMエージェントOS登場 オープンソースの新フレームワーク

本記事では、Web3とエージェントの融合...
Read More

生成AIシステムのセキュリティ評価 マイクロソフトが100事例から得た教訓

本記事では、マイクロソフトの研究チームに...
Read More

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

表やグラフといった構造化された画像は、私...
Read More

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

本記事では、人間が思いついたゲーム理論的...
Read More

産業界における生成AIガイドラインを網羅したデータセット登場

本記事では、企業における大規模言語モデル...
Read More

LLMは個人の金銭管理を適切にサポートできるのか?

本記事では、LLMを利用した個人財務サポ...
Read More

LLM

AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
プロンプトの原則26ヶ条をまとめた報告
LLMのRAG(外部知識検索による強化)をまとめた調査報告
Gemini Pro 対 GPT-4V、画像認識能力でどちらが優秀なのか
消費者向けGPUでも高性能GPUに近いパフォーマンスでLLMを動かす手法「PowerInfer」
OpenAIが開発中の「人間を超えたAIを制御する」方法
Tencentの研究者らが、人間のようにタップやスワイプでスマホアプリを操作するAIエージェント『AppAgent』を開発したと報告しています。
PAGE TOP