次回の更新記事:スマートフォンアプリにおけるLLM活用の開発実態(公開予定日:2025年03月10日)

3Dのリアルな画像から「あらゆるテキストデータを抜きとるAI技術」発表【CVPR2020】

   

関連記事:「3D×AI」の最先端を紹介します。トップ学会に採択された論文たち【CVPR2020】

以下では、画像認識技術のトップ学会であるCVPRにおいて今年発表された論文の中でも、特に筆者が面白いと感じたものを紹介します。テーマは3Dです。

“シーンテキスト”を探す旅

画像には様々な情報が含まれていますが、特に町中での画像には、標識や看板が写っていることがあります。そして基本的に、標識や看板にはテキストが書かれていますが、それらを Scene Text と呼びます。シーンテキスト多くの情報を含んでおり、画像の一部についての説明や手掛かりになっています。この論文は、2次元画像ではなく、3次元シーンからシーンテキストを生成しようという内容です。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。


AIDBとは


AIDBは、論文などの文献に基づいてAIの科学技術や市場にキャッチアップするためのサービスです。個人の研究や仕事探し、法人の調査や採用を支援します。2019年から運営しています。

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録
PAGE TOP