本記事で紹介するのはちょっと変わった事例の話です。研究者らが、自律的に動くAIエージェント、自分でメールを書いたり、シェルコマンドを叩いたり、Discordで他のエージェントとやりとりしたりする「ちょっとした人格を持った召使いAI」を実際にラボに放流して、二週間にわたって二十人の研究者みんなで「壊せるもんなら壊してみろ」と寄ってたかっていじめ抜いた、という体当たりレポートです。

まず前提として、いまのAIエージェントは、ただ文章を返すチャットボットとはちがって、コードを実行したり、ファイルを消したり、メールを送ったりと、現実世界に手を出せるようになってきています。便利な反面、ちょっとした勘違いがそのまま「取り返しのつかない事故」になりやすい。しかも複数のAIエージェントが同じDiscordに居合わせて互いに会話しはじめると、人間が予想していなかった連鎖反応が起きる。
研究者たちはここに注目して、わざと荒っぽい実験環境を作りました。各AIには専用の仮想マシン、永続メモリ、メールアカウント、Discordアクセス、シェル権限が与えられていて、「小さな人格」がインターネットの片隅で24時間生活している状態です。