次回の更新記事:会議出席代行システム LLMでどこまでできるか(公開予定日:2025年02月25日)

LLM

1.1Bパラメータの小さなモデルを巨大データ(約3兆トークン)で訓練したモデル『TinyLlama』が、比較的優秀な性能を発揮
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
LLMが「教えてはいけない事実」を抑制するパーツが明らかに Llama-2を1057個に分解
LLMにおける情報抽出(文章から必要な事柄を読み取る)タスクについての調査
LLMの内部状態を観察することで「出力がハルシネーションか否かを判別する」手法『LLMファクトスコープ』
Geminiの「常識を推論する能力」を網羅的に調査した結果 間違えやすいタイプの問題も明らかに
人間のカリキュラム教育のような学習でLLMの性能は向上するとの報告
AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
プロンプトの原則26ヶ条をまとめた報告
PAGE TOP