LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

論文

小さなRetrieverとLLMの組み合わせによる実用的なワークフロー生成システム またはRAGで幻覚を減らす手法
強くて軽いモデルPhi-3の評価結果 Microsoftの論文(テクニカルレポート)より
プロンプトでLLMにRPAワークフローを自動生成させる手法「FlowMind」JPモルガン考案
LLMにおける、長いコンテキストから欲しい情報を見つけ出す「needle-in-a-haystack(干し草の中の針)」テスト結果とプロンプト例
プロンプトに例を多く載せるほど、どんなタスクでも性能が上がるのか?DeepMindによる『Many-shot Learning』の実験結果
Appleが開発 スマホに特化したマルチモーダルLLM『Ferret UI』
LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング
ChatGPTは学術論文の文章スタイルをどう変えているか?大規模な調査の結果
PAGE TOP