
新しいAIモデルが登場するたび、性能の数字は華々しく語られます。しかしそのモデルが何個のパラメータでできているのか、どれだけ大きいのかは、ほとんど明かされません。
たとえば自社サービスにどのモデルを組み込むか迷っているとします。Aは高性能ですが応答が遅く、料金も高い。Bは性能こそ及ばないものの安く速い。AがBより優れているのは設計が賢いからなのか、それとも単に巨大なだけなのか。そこが分かれば選びやすいのに、肝心の大きさだけが伏せられています。
ところが外から質問を投げ込むだけで、モデルのおおよその大きさを言い当てる手立てが示されました。手がかりになったのは、意外にも誰もが知る古典の名作たちです。本記事では、その仕組みと、そこから浮かび上がった各社の戦略の違いを紹介します。