次回の更新記事:AIエージェントにCEOは務まるか?(公開予定日:2026年06月26日)
AIDB Daily Papers

REVERSE:エージェントによる画像地理位置特定のための証拠検証と検索の強化

原題: REVERSE: Reinforcing Evidence Verification and Search for Agentic Image geo-localization
著者: Yong Li, Furong Jia, Dacheng Yin, Kang Rong, Fengyun Rao, Jing Lyu, Fan Zhang
公開日: 2026-05-26 | 分野: 画像生成 コンピュータビジョン AI 検索 cs.CV AIエージェント

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 本研究では、画像から撮影場所を特定するタスクにおいて、証拠の検索と検証の相互作用を強化するREVERSEフレームワークを提案した。
  • 既存手法が証拠収集の過程を十分に捉えられていない課題に対し、REVERSEは「どこを見るか」「何を検索するか」「どの証拠を信頼するか」を学習させる点で新しい。
  • REVERSEは、視覚的根拠付け、検索クエリの有用性、証拠の識別に対する報酬を導入し、大規模モデルで既存手法を凌駕する結果を示した。

Abstract

Image geo-localization aims to determine where a photograph was taken, a task that often requires more than recognizing visible landmarks. Human experts typically solve it through an iterative workflow: they inspect informative regions, form location hypotheses, seek external evidence, and revise their judgments as new clues appear. Existing methods only partially capture this process: direct prediction methods bypass evidence acquisition altogether, while retrieval-augmented methods introduce external evidence but usually provide limited supervision on the intermediate decisions of where to search, how to query, and how to filter noisy results. We present REVERSE, a framework that reinforces the interplay between evidence search and verification to enable multi-turn agentic reasoning. REVERSE teaches three intermediate decisions: where to look, what to query, and what evidence to trust. To support this, we construct tool-grounded trajectories with annotated region selections, search observations, and geo-informative evidence labels, and introduce process rewards for visual grounding, query utility, and evidence discrimination. An offline search cache makes retrieval observations stable and reusable during reinforcement learning, enabling dense supervision over noisy search results. With a 4B model, REVERSE outperforms strong retrieval-augmented baselines and rivals substantially larger models on Im2GPS3k and YFCC4k. Code is available at https://github.com/yonglleee/REVERSE.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事