次回の更新記事:Web3向けLLMエージェントOS登場 オープンソースの新…(公開予定日:2025年01月20日)

生成AIシステムのセキュリティ評価 マイクロソフトが100事例から得た教訓

本記事では、マイクロソフトの研究チームに...
Read More

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

表やグラフといった構造化された画像は、私...
Read More

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

本記事では、人間が思いついたゲーム理論的...
Read More

産業界における生成AIガイドラインを網羅したデータセット登場

本記事では、企業における大規模言語モデル...
Read More

LLMは個人の金銭管理を適切にサポートできるのか?

本記事では、LLMを利用した個人財務サポ...
Read More

論文

CoT(思考の連鎖)は数学や論理で劇的に性能を向上させる一方、常識や知識のタスクでほとんど効果がない
医療のような専門分野におけるLLMの性能は「知識グラフと再ランキングの併用」で大幅に向上(東京大学Irene Li氏)
GPT-4oに”嘘をつく理由”を与えると正直さが約32.5%減少 LLMは役割に応じて”正直さ”が変化する
単純に生成回数を増やすとLLMの性能が大幅に向上する「推論時のスケーリング則」
リアルなWindowsOS環境でのエージェント能力を評価する『WindowsAgentArena』およびエージェント『Navi(ナビ)』Microsoftが開発
ノーコードでLLMマルチエージェントを操る『AUTOGEN STUDIO』Microsoftが新開発
Self-Reflection(自己反省)がLLMのパフォーマンスに与える影響を網羅的に調査
100人以上の研究者が実験参加 LLMは人間より優れた研究アイデアを思いつくのか?
PAGE TOP