次回の更新記事:既存のベンチマークテストは信頼できるのか?LLM評価…(公開予定日:2025年02月11日)

Google、画像キャプション自動挿入AIを公開!【GitHub】

   

関連記事:AIで画像からフェンスなどの障害を除去する手法が発表【CVPR2020】

視覚的質問回答についての新しい画像キャプションアプローチが登場しました!

背景

画像に対する質問回答などの視覚的質問回答(VQA)は多くの場合一般的な質問とそれに対する答えをキャプションします。このキャプションはこの分野の研究を牽引してきましたが、タスクの最終目的が不明確なことがあります。更に、異なるユーザーの質問に対する答えに対応できないことがあります。

Google ResearchのKenton Leeらは、新しい画像キャプションタスクであるCAPWAPを提案しています。

テクノロジー

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について

■AIDBからのお知らせ
AIの仕事、どうやって探せばいいんだろう?AIDBがそんな皆のためにサービスを運営中。

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。


ロッテノ

投稿者の過去記事

SE2年目に突入。大学では機械工学を専攻していました。製造・工業分野などのAIの活用を深堀して、分かりやすい表現で執筆していきます。

AIDBとは


重要なAI論文にわかりやすい記事でキャッチアップできるサービスです。2019年から運営しています。

AIDBのネットワークを活かして仕事をしよう

登録フォームを表示する
PAGE TOP