AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(854件) 短信(643件) 🔒 論文(17,946件) 🔒

テキストだけでなく画像・動画生成もこなすAmazon Novaモデルファミリー　高性能で高速

2024.12.052025.03.08

深堀り解説

本記事では、Amazonが開発したLLM「Nova」ファミリーの特徴と技術的アプローチを紹介します。

Novaは、テキスト処理から画像・動画生成まで対応可能なマルチモーダルモデルで、異なるサイズのモデルを用意することで、用途や予算に応じた柔軟な選択を可能にしています。

200言語以上のデータを活用しながら、段階的な学習プロセスを採用することで、実用性の高いシステムとして設計されています。

発表者情報

機関：Amazon Artificial General Intelligence

背景

企業や組織が独自のLLMを開発・展開する動きが加速しています。最近では、マルチモーダル処理や長文脈理解など、より高度な機能を備えたモデルの開発競争が激化している状況にあります。

このような状況下で今回新たにAmazonがLLMを開発しました。

開発された『Nova』モデル群は、性能と実用性のバランスを重視した設計思想を持っています。3つの異なるサイズで展開し、用途や予算に応じた選択を可能にしています。また200以上の言語データを活用した多言語対応を実現し、15の主要言語に重点を置いています。またテキスト処理だけでなく画像生成や動画生成にも対応しています。

Novaモデルファミリーの全体構成。各モデルの入出力関係と、それぞれが処理できるデータタイプを示す

研究者らは今回、Novaファミリーの基本的な性能だけでなくエージェント性能、長文コンテキスト処理性能、専門的なドメイン性能を豊富なベンチマークで網羅的に評価し結果をまとめています。
新しいモデルが登場する際に、現在はどのようなベンチマークが使用されるのかといった観点でも興味深い内容になっています。

さらに、画像生成や動画生成においても中立的な評価を行い報告しています。

その結果、性能だけでなく、ユーザー体験に直接影響する生成速度などの側面でも優れていることが示唆されました。

Amazon Nova Pro、Lite、Microの評価

基本的な能力

まずはAmazon Novaモデルのコア性能を評価するため、テキストとマルチモーダルの両方について、一連の公開ベンチマークを用いた評価が行われました。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
研究紹介短信ライブラリの基本機能

プレミアム会員の特典

全過去記事の無制限閲覧
専門家による最新リサーチ結果を記事で購読（平日毎日更新）
日本語検索対応の新着AI論文データベース
研究紹介短信ライブラリの高度な機能を開放
記事内容質問AIを使用可能に

まずはアカウントを作成

ログイン

プレミアム会員について

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

テキストだけでなく画像・動画生成もこなすAmazon Novaモデルファミリー　高性能で高速

背景

Amazon Nova Pro、Lite、Microの評価

基本的な能力

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 いまだ対策が求められる幻覚（ハルシネーション）　プロンプト手法とRAGの組み合わせでLLMの事実性を守る

🔒 人間の思考や感情、それらが行動にどう結びつくかを理解し予測するAI「FutureNet」をMITの研究グループが開発

🔒 LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング

🔒 『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その1　重要な用語と各種プロンプト手法〜

背景

Amazon Nova Pro、Lite、Microの評価

基本的な能力

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 いまだ対策が求められる幻覚（ハルシネーション） プロンプト手法とRAGの組み合わせでLLMの事実性を守る

🔒 人間の思考や感情、それらが行動にどう結びつくかを理解し予測するAI「FutureNet」をMITの研究グループが開発

🔒 LLMが思考のネットワークを構築し、人間の推論プロセスを模倣する『THOUGHTSCULPT』プロンプティング

🔒 『プロンプトレポート』OpenAIなどが作成した調査報告書 〜その1 重要な用語と各種プロンプト手法〜

🔒 いまだ対策が求められる幻覚（ハルシネーション）　プロンプト手法とRAGの組み合わせでLLMの事実性を守る

🔒 『プロンプトレポート』OpenAIなどが作成した調査報告書　〜その1　重要な用語と各種プロンプト手法〜