o1モデルが人間のように6つの思考パターンを使い分けているとの実験結果

本記事では、AIの性能向上における「推論...
Read More

IBMから日本語対応の商用可能オープンソースLLM「GRANITE 3.0」公開 8Bから

本記事では、IBMが新たに開発した軽量な...
Read More

計画のステップが増えるほど、LLMは最初の目標を見失っていく傾向がある

本記事では、LLMを活用したエージェント...
Read More

LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上 最大で30%改善

本記事では、LLMの多段階推論能力を向上...
Read More

エージェント

ノーコードでLLMマルチエージェントを操る『AUTOGEN STUDIO』Microsoftが新開発
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功
「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績
人間を討論で言い負かすディベート上手なLLMの実装
LLMにおける現状のリスクと対策に関するまとめ
LLMのサイバーセキュリティタスク性能評価フレームワーク「Cybench」
PAGE TOP