LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

LLM

GPT-4に選択肢を与えるとき、順序を入れ替えるだけで性能に大きな変化があることが明らかに
「わたしの話」を体系的に覚えてもらいながらLLMと会話する技術MemoChat登場
タスクに応じてロールプレイさせるとChatGPTなどLLMの推論能力は普遍的に向上する
メタ認知をさせてLLMの能力を上げる手法「メタ認知プロンプティング」
大規模言語モデルのセーフガードを故意に突破する「脱獄プロンプト」とは
Metaの研究者ら「GPT-4をきびしくサポートする」AIのShepherd(シェパード)開発
医療AIの性能を検証する大規模プロジェクト、MITやハーバード、マイクロソフトなど始動
カーネギーメロン大など、大規模言語モデルの脆弱性を突く攻撃手法が存在することを指摘
PAGE TOP