本記事では、Amazonが開発したLLM「Nova」ファミリーの特徴と技術的アプローチを紹介します。
Novaは、テキスト処理から画像・動画生成まで対応可能なマルチモーダルモデルで、異なるサイズのモデルを用意することで、用途や予算に応じた柔軟な選択を可能にしています。
200言語以上のデータを活用しながら、段階的な学習プロセスを採用することで、実用性の高いシステムとして設計されています。
発表者情報
- 機関:Amazon Artificial General Intelligence
背景
企業や組織が独自のLLMを開発・展開する動きが加速しています。最近では、マルチモーダル処理や長文脈理解など、より高度な機能を備えたモデルの開発競争が激化している状況にあります。
このような状況下で今回新たにAmazonがLLMを開発しました。
開発された『Nova』モデル群は、性能と実用性のバランスを重視した設計思想を持っています。3つの異なるサイズで展開し、用途や予算に応じた選択を可能にしています。また200以上の言語データを活用した多言語対応を実現し、15の主要言語に重点を置いています。またテキスト処理だけでなく画像生成や動画生成にも対応しています。
研究者らは今回、Novaファミリーの基本的な性能だけでなくエージェント性能、長文コンテキスト処理性能、専門的なドメイン性能を豊富なベンチマークで網羅的に評価し結果をまとめています。
新しいモデルが登場する際に、現在はどのようなベンチマークが使用されるのかといった観点でも興味深い内容になっています。
さらに、画像生成や動画生成においても中立的な評価を行い報告しています。
その結果、性能だけでなく、ユーザー体験に直接影響する生成速度などの側面でも優れていることが示唆されました。
Amazon Nova Pro、Lite、Microの評価
基本的な能力
まずはAmazon Novaモデルのコア性能を評価するため、テキストとマルチモーダルの両方について、一連の公開ベンチマークを用いた評価が行われました。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。