次回の更新記事:LLMを利用した「自動データクリーニング」方法(公開予定日:2024年12月13日)

テキストだけでなく画像・動画生成もこなすAmazon Novaモデルファミリー 高性能で高速

   

本記事では、Amazonが開発したLLM「Nova」ファミリーの特徴と技術的アプローチを紹介します。

Novaは、テキスト処理から画像・動画生成まで対応可能なマルチモーダルモデルで、異なるサイズのモデルを用意することで、用途や予算に応じた柔軟な選択を可能にしています。

200言語以上のデータを活用しながら、段階的な学習プロセスを採用することで、実用性の高いシステムとして設計されています。

【告知】AIDB HRの人材側登録者全員に対し、業界研究の手間を削減できるように「AI事業を行う企業リスト」を配布します。無料登録後すぐに閲覧とダウンロードが可能です。▼



発表者情報

  • 機関:Amazon Artificial General Intelligence

背景

企業や組織が独自のLLMを開発・展開する動きが加速しています。最近では、マルチモーダル処理や長文脈理解など、より高度な機能を備えたモデルの開発競争が激化している状況にあります。

このような状況下で今回新たにAmazonがLLMを開発しました。

開発された『Nova』モデル群は、性能と実用性のバランスを重視した設計思想を持っています。3つの異なるサイズで展開し、用途や予算に応じた選択を可能にしています。また200以上の言語データを活用した多言語対応を実現し、15の主要言語に重点を置いています。またテキスト処理だけでなく画像生成や動画生成にも対応しています。

Novaモデルファミリーの全体構成。各モデルの入出力関係と、それぞれが処理できるデータタイプを示す

研究者らは今回、Novaファミリーの基本的な性能だけでなくエージェント性能、長文コンテキスト処理性能、専門的なドメイン性能を豊富なベンチマークで網羅的に評価し結果をまとめています。
新しいモデルが登場する際に、現在はどのようなベンチマークが使用されるのかといった観点でも興味深い内容になっています。

さらに、画像生成や動画生成においても中立的な評価を行い報告しています。

その結果、性能だけでなく、ユーザー体験に直接影響する生成速度などの側面でも優れていることが示唆されました。

Amazon Nova Pro、Lite、Microの評価

基本的な能力

まずはAmazon Novaモデルのコア性能を評価するため、テキストとマルチモーダルの両方について、一連の公開ベンチマークを用いた評価が行われました。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について









■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP