次回の更新記事:今週の注目AI論文リスト(論文公開日2025/11/9~11/1…(公開予定日:2025年11月16日)

LLM

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証
LLMプロジェクト開発に必要な新しい概念「AgentOps」とは
オープンソースのコード生成LLMが商用LLMに追いつく Qwen2.5-Coderの能力値全容
画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど
Llama 3.1シリーズ、8ビット量子化で半分以下のサイズでも性能をほぼ完全維持、実験で確認
LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける
上司役のLLMが部下LLMたちに的確に仕事を振り分ける『Magentic-One』マイクロソフトが開発
「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ
LLMの機能別「領域」はまるで脳のようであるとの仮説
直感に頼るようなタスクだとLLMに「ステップバイステップで考えて」は逆効果
LLMの「知っているのに嘘をつく」幻覚と「知らないから間違える」幻覚の違い
OpenAIが新しくLLMの事実性評価ベンチマーク『SimpleQA』をリリース 実用に役立つ知見も得られる
LLMが自分で「より賢いLLMの作り方」を発見するSelf-Developingフレームワーク(NEC 石橋陽一氏)
LLMに対するオープンソース安全性評価ツールの比較
プレイヤーの行動に応じてゲームを自動生成する技術 Googleなどが開発

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP