ハルシネーション診断
更新: 2026/06/23
LLMエージェントの出力がおかしいとき、失敗の原因を4次元 (知識誤り/知識欠落/推論ミス/指示違反)に切り分けて特定し、 トレードオフを踏まえた対応策を選ぶための診断スキル。 RAG評価、エージェント品質管理、モデル選定、プロンプト改善の 前段として使う。
エージェントへのインストール
SKILL.md ベースの Agent Skill です(agentskills.io の共通フォーマット。Claude / Codex などで利用可)。
- Claude Code: ファイルを
~/.claude/skills/llm-failure-diagnosis/に配置(プロジェクト単位なら .claude/skills/) - OpenAI Codex (CLI): ファイルを
~/.agents/skills/llm-failure-diagnosis/に配置(プロジェクト単位なら .agents/skills/)。$または/skillsで呼び出し(説明文に応じた自動選択も可) - Claude.ai / アプリ: 設定 → Capabilities → Skills から zip をアップロード
- Claude API:
POST /v1/skillsに zip をアップロード