LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

LLM

AGIへのロードマップ カーネギーメロン大学など複数機関からの研究グループが提唱
多くの「長いコンテキストを要するタスク」を、短いコンテキストウィンドウのLLMで解決する手法
時系列データの異常検知にLLMを使用する手法と実行プロンプト
自然言語プログラミングを可能にするシステム『CoRE』
LLMでプログラミング言語間の翻訳を行うプロンプト手法 C、Go→Rustのケーススタディ結果
LLMエージェントの設計16パターン 
ファインチューニングがLLMの幻覚(ハルシネーション)に与える影響 Googleなどによる検証結果
GPT-4o、Gemini、Claude 3などにおける「長いプロンプトのマルチモーダルタスク」性能を測定した結果
PAGE TOP