LLMの推論能力は単純に文脈を繰り返すだけでも大幅に向上 最大で30%改善

本記事では、LLMの多段階推論能力を向上...
Read More

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

本記事では、1枚の画像から高精度な奥行き...
Read More

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場

本記事では、LLMを活用した大規模マルチ...
Read More

「o1」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い

本記事では、OpenAIが開発した新しい...
Read More

LLM

現実世界の確率分布における言語モデルの推定能力と改善方法 Googleが検証
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その3 プロンプトエンジニアリングのケーススタディ〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その2 マルチモーダルとエージェント〜
『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜
包括的なRAG評価ベンチマーク『CRAG』Metaなどが開発
人とLLMの実際のチャット履歴から抽出した1,024のリアルなタスクでClaude 3などを評価した結果
LLMは与えられたペルソナ(役割)に応じてバイアスが変化することが明らかに
マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告
PAGE TOP