次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

論文

「AIが自動的に優れたAIエージェントを設計する」新分野の提唱 数学エージェントが読解でも好成績
RAGで検索文書の要約を活用したクエリ書き換えが検索精度を大幅に向上させる AWS報告
人間を討論で言い負かすディベート上手なLLMの実装
プロンプトの影響によるLLMの性能のばらつきを考慮した評価指標「Sharpeスコア」 NAIST研究者ら考案
モデルとデータの大規模化で変化するLLMのハルシネーション Google DeepMindの研究
LLMにおける現状のリスクと対策に関するまとめ
LLMのサイバーセキュリティタスク性能評価フレームワーク「Cybench」
民事裁判をLLMで模倣 シミュレートを経てLLMの法律能力が強化される
Google DeepMindがリリースした新世代の画像生成モデル「Imagen 3」テクニカルレポート
LLMの事前学習とファインチューニングの関係
PAGE TOP