LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

LLMの機能別「領域」はまるで脳のようであるとの仮説

本記事では、LLMの内部で発見された驚く...
Read More

論文

100万体のLLMエージェントによるシミュレーションを実験できる環境が登場
「o1」は従来のモデルとは明確に異なり「珍しいタイプの問題」にも強い
対話の中でユーザーの好みを学ぶ手法『CIPHER』 (プロンプトテンプレートあり)
専門家が作成したプロンプトと同等以上の性能を達成する自動プロンプト生成手法『Minstriel』
米国3人に1人が生成AIを使用 ブルーカラー労働者も生産性向上 大規模調査より 
LLMの論理的推論能力をステップバイステップ以上に向上させる手法『Logic-of-Thought』プロンプティング(テンプレートつき)
RAG-LLMシステムへのユーザークエリは4つのレベルに分類できる 最も複雑なのは「隠れた根拠からの推論が必要なクエリ」Microsoftによる研究
OpenAIの新しいモデルo1、従来のLLMと比べて「計画能力」で圧倒的な性能向上
PAGE TOP