最新の記事:科学は「研究」と「査読」両方が加速していく AIと…
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

2024.10.09
深堀り解説

本記事では、1枚の画像から高精度な奥行き情報を高速で推定するモデル「Depth Pro」を紹介します。これまでの手法では難しかった、カメラの内部パラメータなしでの正確な奥行き推定や、髪の毛や毛皮などの細かい構造の捕捉が可能になりました。

参照論文情報

  • タイトル:Depth Pro: Sharp Monocular Metric Depth in Less Than a Second
  • 著者:Aleksei Bochkovskii, Amaël Delaunoy, Hugo Germain, Marcel Santos, Yichao Zhou, Stephan R. Richter, Vladlen Koltun
  • 研究機関:Apple

背景

1枚の画像から奥行き情報を推定する技術(深度推定)が発展しています。深度推定は、画像編集や画像生成などへのさまざまな応用可能性を秘めています。

これまでの研究では、次のような課題がありました。

  1. 予測された奥行き情報の精度が十分ではなかった
  2. カメラの内部パラメータ(焦点距離など)が必要で、一般的な画像には適用できなかった
  3. 物体の輪郭がぼやけてしまい、細かい構造を正確に捉えられなかった
  4. 処理に時間がかかり、リアルタイムでの使用が難しかった

そこで例えば、多様なデータセットを使った学習や、新しいネットワーク構造が試されてきました。しかし、依然として難しい状況でした。中でもカメラの内部パラメータなしで正確な奥行きを推定することや、髪の毛や毛皮などの細かい構造を正確に捉えることが困難でした。

そんな中、今回Appleの研究者らはこれらの課題を一度に解決するモデル『Depth Pro』を開発しました。

以下で紹介します。

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能
  • プロンプト管理ツールの利用

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に
  • プロンプト管理ツールの無制限使用

記事検索

年/月/日
年/月/日

関連記事