次回の更新記事:Cursorはソフトウェア開発を加速する?導入後の実態…(公開予定日:2025年11月11日)

LLM

LLMの知識を狙い撃ちして変更・修正する「知識編集(Knowledge Editing)」
LLMに「自分自身との対戦」で能力を向上させる手法『Self-Play Fine-Tuning(SPIN)』
1.1Bパラメータの小さなモデルを巨大データ(約3兆トークン)で訓練したモデル『TinyLlama』が、比較的優秀な性能を発揮
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
LLMが「教えてはいけない事実」を抑制するパーツが明らかに Llama-2を1057個に分解
LLMにおける情報抽出(文章から必要な事柄を読み取る)タスクについての調査
LLMの内部状態を観察することで「出力がハルシネーションか否かを判別する」手法『LLMファクトスコープ』
Geminiの「常識を推論する能力」を網羅的に調査した結果 間違えやすいタイプの問題も明らかに
人間のカリキュラム教育のような学習でLLMの性能は向上するとの報告
AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
プロンプトの原則26ヶ条をまとめた報告
LLMのRAG(外部知識検索による強化)をまとめた調査報告
Gemini Pro 対 GPT-4V、画像認識能力でどちらが優秀なのか
消費者向けGPUでも高性能GPUに近いパフォーマンスでLLMを動かす手法「PowerInfer」

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP