次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

論文

LLMから「LLMエージェント」へ ソフトウェアエンジニアリングにおける今後の展開
LLMの出力をJSON形式などに構造化すると「思考の柔軟性」や精度に影響することが示唆される
Sakana AIが科学研究自動化フレームワーク『The AI Scientist』開発
LLMを「人間の心のケア」を行うカウンセリングAIとして実行するためのプロンプト手法
「LLMはプロンプトから新しいタスクを学べるのか?」 という根本的な問いに対する3つの仮説を検証
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
LLMベースの万能エンジニアを構築する『OpenDevin』プラットフォーム
LLMは人間のような「共感的な対話」ができるか?実行プロンプトと検証結果
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
Appleが「LLMエージェントの評価」に特化したベンチマーク『MMAU』を開発 5領域5能力で測る
PAGE TOP