次回の更新記事:Web3向けLLMエージェントOS登場 オープンソースの新…(公開予定日:2025年01月20日)

3Dのリアルな画像から「あらゆるテキストデータを抜きとるAI技術」発表【CVPR2020】

   

関連記事:「3D×AI」の最先端を紹介します。トップ学会に採択された論文たち【CVPR2020】

以下では、画像認識技術のトップ学会であるCVPRにおいて今年発表された論文の中でも、特に筆者が面白いと感じたものを紹介します。テーマは3Dです。

“シーンテキスト”を探す旅

画像には様々な情報が含まれていますが、特に町中での画像には、標識や看板が写っていることがあります。そして基本的に、標識や看板にはテキストが書かれていますが、それらを Scene Text と呼びます。シーンテキスト多くの情報を含んでおり、画像の一部についての説明や手掛かりになっています。この論文は、2次元画像ではなく、3次元シーンからシーンテキストを生成しようという内容です。


【AIDBから新サービスのお知らせ】


当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






AIDBの新サービス

PAGE TOP