
AIに「じっくり考えて」と頼むと、答えが良くなる。そう感じている人は多いはずです。問題を細かく分け、一歩ずつ考えさせると、難しい計算や推論でも正解に近づく。推論モデルが広く使われるようになってから、この感覚はさらに強まりました。
ところが、すべての作業でそうなるわけではありません。
たとえば、コードの中である変数が何度も書き換えられ、最後にどんな値になるかを追う作業があります。あるいは、複数のテーブルをまたいでデータを結合するクエリを組み立てる作業もあります。こうした作業をモデルの内部推論だけに任せると、数秒で解けるはずの問題に長く考え込み、最後には間違った答えを返すことがあります。
問題は、単に「長く考えても間違う」ことではありません。むしろ、長く考えさせたことで、途中の状態が少しずつずれていく場合があるのです。
この現象は、これからのエージェント設計にかなり関係します。どこまでをモデルに考えさせ、どこから先を計算機、ソルバー、コード実行環境のような外部ツールに渡すべきなのか。その境目を調べた研究から、実務で使える手がかりが見えてきます。