次回の更新記事:Web3向けLLMエージェントOS登場 オープンソースの新…(公開予定日:2025年01月20日)

生成AIシステムのセキュリティ評価 マイクロソフトが100事例から得た教訓

本記事では、マイクロソフトの研究チームに...
Read More

マルチモーダルLLMによる表やグラフの理解力を向上させる方法

表やグラフといった構造化された画像は、私...
Read More

LLMエージェントによって自然言語をゲーム理論モデルに変換する方法

本記事では、人間が思いついたゲーム理論的...
Read More

産業界における生成AIガイドラインを網羅したデータセット登場

本記事では、企業における大規模言語モデル...
Read More

LLMは個人の金銭管理を適切にサポートできるのか?

本記事では、LLMを利用した個人財務サポ...
Read More

論文

ロングコンテキストLLMでも、情報の数は「多ければ多いほど良い」わけではない
OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮
LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上 最大で30%改善
「あなたは〇〇です」などのペルソナ設定を与えても、事実に基づく質問への回答精度は向上しないとの主張
複雑なプログラミングタスクに特化したベンチマーク『BigCodeBench』登場 最新モデルでも60%
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
ハーバード大学とGoogleの研究者ら、LLMチャットボットを総合的に評価するデータセットの作り方を報告(作成されたデータセットも公開)
100万体のLLMエージェントによるシミュレーションを実験できる環境が登場
PAGE TOP