Loading [MathJax]/extensions/tex2jax.js
次回の更新記事:「賢くしゃべる家電」は実現できるか?LLMを用いて、…(公開予定日:2025年04月23日)

LLM

GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
単純に生成回数を増やすとLLMの性能が大幅に向上する「推論時のスケーリング則」
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
ノーコードでLLMマルチエージェントを操る『AUTOGEN STUDIO』Microsoftが新開発
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
LLMの推論能力を戦略的に向上させる新しいプロンプト手法『SCoT』
AIコーディング補助ツール(GitHub Copilot)で開発者の生産性が26%向上 Microsoft・アクセンチュアなど3社の大規模調査結果
マルチモーダルLLMの高難易度ベンチマーク『MMMU-Pro』で明らかになったこと
ロングコンテキストLLM台頭の今もRAGを使用する理由
RAGの検索データにおける「ノイズ(事実とは異なる情報など)」には有益なノイズと有害なノイズがある
RAGの検索精度を実務レベルに高めるには、「情報ごとに ”質問文” を作りデータベースに入れる」のが効果的との報告
プロンプトに5つほど”価値観の例”を示すだけで、LLMは特定の文化に適応した回答ができるようになるとの報告
GPT-4oで保険、銀行、小売りなどで人間への売り込みを実験 最大35%の確率で購買決定に成功
「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP