深堀り解説ベンチマーク・リソース 🔒 日常能力を試すテスト『GAIA』正答率、人間92%に対してGPT-4は15% 一般的なニーズに応えるAI開発の指針に 2023.11.272025.03.08 クリップする