
AIエージェントを業務に合わせようとしても、モデルの重みまで変更できる場面はほとんどありません。現実には、手順や注意点を自然言語で書いたスキルに頼ることになります。
ある大規模な検証では、2,000トークンに満たない短い文書を添えるだけで、最新モデルの正答率が6タスク平均で20ポイント以上向上しました。モデルの重みは一切変えていません。
ただし、スキルは書けば何でも効くわけではありません。どう直すかによって効果は大きく変わり、やり方を誤るとかえって精度が下がります。では、文書を着実に良くしていくには何が必要で、最終的にどのような文書が残るのでしょうか。