次回の更新記事:企業実務タスクにおけるLLMエージェントの能力を評価…(公開予定日:2024年12月23日)

動画を理解する軽量なLLM『Apollo』、オープンソースで登場(商用利用も可能)

本記事では、動画を理解する大規模マルチモ...
Read More

LLMエージェントに人間のような欲求を持たせてシミュレーションする手法

本記事では、人間らしい行動を再現するLL...
Read More

LLM同士による人工言語コミュニケーションで発見された「言語構造の創発」

本記事では、LLMが人工言語を学習・使用...
Read More

LLMを利用した「自動データクリーニング」方法

本記事では、データ活用の現場で大きな壁と...
Read More

研究活動におけるLLMの「使われ方」や「好まれ方」に関する実態調査の結果

本記事では、816名の研究者を対象とした...
Read More

LLMの開発トレンドに新たに見出された『密度化の法則』および『能力密度』の概念

本記事では、LLMにおける新しい評価指標...
Read More

LLMにおける事実性の評価&向上に役立つデータセットの作り方

本記事では、LLMが抱える「ハルシネーシ...
Read More

OpenAI o1モデルファミリー登場 その特徴の全貌

この記事では、OpenAIがついにo1モ...
Read More

エージェント

LLMから「LLMエージェント」へ ソフトウェアエンジニアリングにおける今後の展開
Sakana AIが科学研究自動化フレームワーク『The AI Scientist』開発
LLMベースの万能エンジニアを構築する『OpenDevin』プラットフォーム
Appleが「LLMエージェントの評価」に特化したベンチマーク『MMAU』を開発 5領域5能力で測る
Among UsのようなゲームでLLMエージェントはどれほど活躍できるか
キャラが自律的に対話しながら物語の台本を生成するLLMベースのシステム『IBSEN』
LLMで心理評価をゲーミフィケーションする方法
エージェントなしで行うLLMによるソフトウェアのバグ修正手法
PAGE TOP