いまポケモンは、NeurIPS・ICML・AAMASといったトップ会議で採択される「本気のAIベンチマーク」になっています。数学やコード生成のテストでは見えない弱点が、このゲームで次々に暴かれています。

本記事では「ポケモンでAIの能力を測る」ことへの挑戦をつづった5本の研究論文・テクニカルレポートをもとに、この分野を横断的に見ていきます。
なぜAI研究でポケモン?
AIの能力を試すなら、チェスや囲碁でいいじゃないかと思うかもしれません。実際、AlphaGoやStockfishがとっくに人間を超えた分野です。でも研究者たちが「それでは測れない能力がある」と言い始めたところに、ポケモンが出てきます。