次回の更新記事:「データは多ければ良い」は本当か?データを減らし…(公開予定日:2025年11月12日)

長文コンテキスト

どのLLMが最も長文要約性能が高いのか評価した実験結果 データセットと要約ノウハウも公開
LLMが生成した長いテキストにおける「事実性」を自動で評価するLLMエージェントフレームワーク『SAFE』Google DeepMindが開発
GPT-4やGeminiなどさまざまなLLMで、プロンプトの入力が長くなるにつれて推論性能に顕著な低下が見られる
1,000,000,000(10億)トークンまでのテキストを一度に処理するモデル「LongNet」登場

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP