次回の更新記事:AIが書いた小説は「文体」だけではなく「物語の骨格…(公開予定日:2026年04月09日)

記事一覧

社内システムの操作をAIエージェントに任せたい。そう考える企業が急速に増えています。チケット起票、在庫更新、顧客レコードの編集。こうしたタスクをエージェントに代行させるために、ブラウザを自動操作させたり、専用のツール群を整備したりと、各社がさまざまな仕組みを試しています。

ところが最近、ある研究チームが面白い実験をしました。ターミナル(コマンドを打ち込む黒い画面)とファイルシステムだけを与えたシンプルなエージェントに、ServiceNow、GitLab、ERPNextという3つの業務プラットフォームで730近いタスクを解かせました。高度なツール群もブラウザも使わせず、curlコマンドとAPIだけで戦わせた結果は、多くの人の予想を裏切るものでした。

iPad Proを注文するという一つのタスクを見てみましょう。ツール連携型のエージェントは、カタログ商品を見つけたものの「注文する」ためのツールが存在せず、代わりにサポートチケットを起票して失敗しました。ブラウザ型はカタログページにたどり着いたものの、画面の入れ子構造に翻弄され、25ステップ、4ドル以上かけて結局注文できませんでした。一方、ターミナル型はJSONの書式エラーや間違ったAPIの宛先に遭遇しながらも、送信データを一時ファイルに書き出し、別の宛先を自力で探し当てて、11ステップ、わずか0.78ドルで注文を完了しています。

エージェント三つ巴の構図

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に