マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告

Googleの研究チームは、マルチモーダルLLMを用いて画像から豊かなテキスト(説明文)を作り出すことで、視覚的特徴とテキストの特徴を組み合わせ、従来手法よりもゼロショット画像分類の精度を向上させています。 本記事の関連 … 続きを読む マルチモーダルLLMは従来手法よりゼロショット画像分類の精度が大幅に向上 Googleが報告