AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(1,007件) 短信(747件) 🔒 論文(30,457件) 🔒

Gemma 4は何が得意で何が苦手か

2026.04.14

社内でLLMを動かそうとして、最初に「あれ、GPUメモリ足りないぞ」となった経験はないでしょうか。そこで気になってくるのがMoE（Mixture-of-Experts）と呼ばれるタイプのモデルです。総パラメータ数は大きいけれど、推論のたびに使うのは一部だけ。だからメモリも計算も軽くて済むはず、と期待される設計です。

ところが実際に動かしてみると、話はそんなに単純ではありませんでした。小さなMoEが大きなDenseモデルに勝つ場面もあれば、逆にぼろぼろに負ける場面もあります。明暗を分けているのは、どうやらアーキテクチャだけではないようです。

本記事では、Gemma 4・Phi-4・Qwen3の各ファミリーから計7つのオープンウェイトモデルを、まったく同じ条件で並べて比較した実証研究を紹介します。精度だけでなく、レイテンシやGPUメモリの使用量まで丁寧に測ったところ、モデル選定で見落としがちな落とし穴がいくつも見えてきました。

たとえば、プロンプトの書き方をちょっと変えただけで、あるモデルの算数の正答率が一気に崩れた事例もあります。精度とコストの最適解は、モデルのスペック表をどれだけ眺めても出てきません。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
研究紹介短信ライブラリの基本機能

プレミアム会員の特典

全過去記事の無制限閲覧
専門家による最新リサーチ結果を記事で購読（平日毎日更新）
日本語検索対応の新着AI論文データベース
研究紹介短信ライブラリの高度な機能を開放
記事内容質問AIを使用可能に

まずはアカウントを作成

ログイン

プレミアム会員について

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

Gemma 4は何が得意で何が苦手か

💬 プレミアム会員ディスカッション

記事検索

こちらもどうぞ

🔒 LLMにテキスト分類を頼むときのコスト効率が良いやり方

🔒 LLMエージェント間で観察された人間のような「意見の二極化」