次回の更新記事:人間の脳を模したAIの記憶システムを作成する方法(公開予定日:2026年06月02日)

AIの能力を世界基準で測る共通の物差し

評価・ベンチマーク(モデル評価、ベンチマーク、性能測定)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

「AIは人間を超えた」「AIは人間に遠く及ばない」
この二つが同時に存在しているのが現状ですが、実はどちらも正しいです。なぜなら、そもそも「人間レベル」という尺度があいまいだから。
そこでケンブリッジ大学などの研究者らは、
「世界中の人間を基準とした共通の物差しを作ろう」と考えました。

彼らは、国際学力調査のデータをもとに、問題ごとに「世界人口の何%が正解できるか」を推定し、実際にAIの能力をその定規で測れるようにしました。

その結果、AIが人間を超えているのは主に「知識」の軸で、逆に人間は「注意力」や「メタ認知」といった”考える力”でAIに勝っていることが示唆されました。

面白いのは、人間にとっては能力別で「難しさ」の度合いがまったく違うこと。
たとえば「長い文脈を処理する力」は、問題が少し難しくなるだけで人間の正答率は激減します。一方「言語理解力」は、問題が難しくなっても正答率があまり下がらない。
AIにとっては、また別の様相を呈するでしょう。この非対称性こそが、「人間レベル」を一言で語れない本質的な理由のひとつかもしれません。

こちらもどうぞ