
AIエージェントに一度きりの応答ではなく、数日から数週間かかる仕事を任せるケースが増えてきました。ほかのエージェントとやり取りしながら判断を重ねていく使い方も、すでに試され始めています。
では、事業の運営をまるごと任せて、複数の競合と並べて数か月走らせたら、何が起きるのでしょうか。きちんと交渉し、在庫をさばき、利益を積み上げていけるのか。それとも、問題なさそうに見えて、いつの間にか手が止まってしまうのか。
コーヒーのサプライチェーンを模した仮想経済でその検証が行われ、モデルごとの成績にはっきり差がつきました。利益を分けたのは何か、どんな失敗が起きたのか。順に見ていきます。