次回の更新記事:AIによるレガシーシステムのモダナイズ、暗黙の業務…(公開予定日:2026年06月25日)
🚀
その他 初級

ハルシネーション診断

更新: 2026/06/23

LLMエージェントの出力がおかしいとき、失敗の原因を4次元 (知識誤り/知識欠落/推論ミス/指示違反)に切り分けて特定し、 トレードオフを踏まえた対応策を選ぶための診断スキル。 RAG評価、エージェント品質管理、モデル選定、プロンプト改善の 前段として使う。

エージェントへのインストール

SKILL.md ベースの Agent Skill です(agentskills.io の共通フォーマット。Claude / Codex などで利用可)。

  • Claude Code: ファイルを ~/.claude/skills/llm-failure-diagnosis/ に配置(プロジェクト単位なら .claude/skills/)
  • OpenAI Codex (CLI): ファイルを ~/.agents/skills/llm-failure-diagnosis/ に配置(プロジェクト単位なら .agents/skills/)。$ または /skills で呼び出し(説明文に応じた自動選択も可)
  • Claude.ai / アプリ: 設定 → Capabilities → Skills から zip をアップロード
  • Claude API: POST /v1/skills に zip をアップロード
シェア