次回の更新記事:ソフトウェア開発におけるLLMマルチエージェントの設…(公開予定日:2025年11月19日)

投稿者の過去記事

医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東京大学Irene Li氏)
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
生成回数を増やすだけでLLMの性能が大幅に向上するシンプルな法則 実用上のポイント
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
ノーコードでLLMマルチエージェントを操る『AUTOGEN STUDIO』Microsoftが新開発
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
ロングコンテキストLLM台頭の今もRAGを使用する理由
RAGの検索データにおける「ノイズ(事実とは異なる情報など)」には有益なノイズと有害なノイズがある
RAGの検索精度を実務レベルに高めるには、「情報ごとに ”質問文” を作りデータベースに入れる」のが効果的との報告
プロンプトに5つほど”価値観の例”を示すだけで、LLMは特定の文化に適応した回答ができるようになるとの報告
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP