深堀り解説ベンチマーク・リソース 🔒 AGIを見据えて専門家レベルの問題を集めたベンチマーク「MMMU」、GPT-4VやGemini Ultraでも正解率6割未満 2023.12.302025.03.08 クリップする
深堀り解説ベンチマーク・リソース 🔒 あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』 2023.12.212025.03.08 クリップする
深堀り解説テクニカルレポート 🔒 Geminiの高い推論能力を活かして、過去最高水準のプログラミングAI『AlphaCode 2』も誕生したとの報告 2023.12.082025.04.27 クリップする
深堀り解説手法 🔒 DeepMindの『GNoME』が「人間の直感を超えた220万の材料を発見し」うち736は既に人間が実験室で再現したとの報告、Nature誌 2023.12.052025.03.08 クリップする