最新の記事:科学は「研究」と「査読」両方が加速していく AIと…
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

テキストだけでなく画像・動画生成もこなすAmazon Novaモデルファミリー 高性能で高速

2024.12.05
深堀り解説

本記事では、Amazonが開発したLLM「Nova」ファミリーの特徴と技術的アプローチを紹介します。

Novaは、テキスト処理から画像・動画生成まで対応可能なマルチモーダルモデルで、異なるサイズのモデルを用意することで、用途や予算に応じた柔軟な選択を可能にしています。

200言語以上のデータを活用しながら、段階的な学習プロセスを採用することで、実用性の高いシステムとして設計されています。

発表者情報

  • 機関:Amazon Artificial General Intelligence

背景

企業や組織が独自のLLMを開発・展開する動きが加速しています。最近では、マルチモーダル処理や長文脈理解など、より高度な機能を備えたモデルの開発競争が激化している状況にあります。

このような状況下で今回新たにAmazonがLLMを開発しました。

開発された『Nova』モデル群は、性能と実用性のバランスを重視した設計思想を持っています。3つの異なるサイズで展開し、用途や予算に応じた選択を可能にしています。また200以上の言語データを活用した多言語対応を実現し、15の主要言語に重点を置いています。またテキスト処理だけでなく画像生成や動画生成にも対応しています。

Novaモデルファミリーの全体構成。各モデルの入出力関係と、それぞれが処理できるデータタイプを示す

研究者らは今回、Novaファミリーの基本的な性能だけでなくエージェント性能、長文コンテキスト処理性能、専門的なドメイン性能を豊富なベンチマークで網羅的に評価し結果をまとめています。
新しいモデルが登場する際に、現在はどのようなベンチマークが使用されるのかといった観点でも興味深い内容になっています。

さらに、画像生成や動画生成においても中立的な評価を行い報告しています。

その結果、性能だけでなく、ユーザー体験に直接影響する生成速度などの側面でも優れていることが示唆されました。

Amazon Nova Pro、Lite、Microの評価

基本的な能力

まずはAmazon Novaモデルのコア性能を評価するため、テキストとマルチモーダルの両方について、一連の公開ベンチマークを用いた評価が行われました。

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能
  • プロンプト管理ツールの利用

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に
  • プロンプト管理ツールの無制限使用

記事検索

年/月/日
年/月/日

関連記事