マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告

Googleの研究チームは、マルチモーダルLLMを用いて画像から豊かなテキスト（説明文）を作り出すことで、視覚的特徴とテキストの特徴を組み合わせ、従来手法よりもゼロショット画像分類の精度を向上させています。本記事の関連 … 続きを読むマルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上　Googleが報告