深堀り解説ベンチマーク・リソース 🔒 あらゆるLLMを「使い心地」基準でバトルさせる便利なプラットフォーム『Chatbot Arena:チャットボットアリーナ』 2023.12.212025.03.08 クリップする
深堀り解説テクニカルレポート 🔒 Geminiの高い推論能力を活かして、過去最高水準のプログラミングAI『AlphaCode 2』も誕生したとの報告 2023.12.082025.04.27 クリップする
深堀り解説手法 🔒 DeepMindの『GNoME』が「人間の直感を超えた220万の材料を発見し」うち736は既に人間が実験室で再現したとの報告、Nature誌 2023.12.052025.03.08 クリップする
深堀り解説ベンチマーク・リソース 🔒 日常能力を試すテスト『GAIA』正答率、人間92%に対してGPT-4は15% 一般的なニーズに応えるAI開発の指針に 2023.11.272025.03.08 クリップする
深堀り解説テクニカルレポート 🔒 Microsoftの研究者ら、比較的小さなサイズでもタスクによってはOpenAIのGPT-4を凌駕する言語モデル『Orca2』を開発 2023.11.242025.03.08 クリップする