Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査

この記事では、LLMが自分自身の行動を反...
Read More

LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』

この記事では、LLMの推論能力を向上させ...
Read More

ロングコンテキストLLM台頭の今もRAGを使用する理由

この記事では、LLMが長い文章を理解でき...
Read More

論文

リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
ノーコードでLLMマルチエージェントを操る『AUTOGEN STUDIO』Microsoftが新開発
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
ロングコンテキストLLM台頭の今もRAGを使用する理由

業界/カテゴリー

PAGE TOP