画像認識 | AIDB

menu

ホーム
画像認識

次回の更新記事：Cursorはソフトウェア開発を加速する？導入後の実態…（公開予定日：2025年11月11日）

画像認識

2024/11/26
LLM オープンソース推論モデル有料記事画像認識論文

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1（11Bパラメータ）

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1（11Bパラメータ）

2024/10/9
有料記事画像生成画像認識論文

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

2024/8/7
有料記事画像認識論文

漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発

漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発

2024/8/2
有料記事画像認識論文

画像と「動画」の中にあるものを認識する『SAM 2（Segment Anything 2）』をMetaが開発

画像と「動画」の中にあるものを認識する『SAM 2（Segment Anything 2）』をMetaが開発

2024/6/25
LLM プロンプト有料記事画像認識論文

タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought（ホワイトボード思考法）』

タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought（ホワイトボード思考法）』

2024/4/4
LLM 有料記事画像認識論文

Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル

Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル

2024/1/8
LLM OCR ニュース画像認識

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。

2023/12/29
LLM ニュース画像生成画像認識音声

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。

2023/12/11
LLM 有料記事画像認識論文

「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル（LVM）を構築するアプローチを開発

「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル（LVM）を構築するアプローチを開発

2023/10/11
LLM オープンソース有料記事画像認識論文

画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い

画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い

「1枚絵の3D化」が非常に手軽な操作で実行できる軽快なツール『DreamGaussian』とWebでの使い方

「1枚絵の3D化」が非常に手軽な操作で実行できる軽快なツール『DreamGaussian』とWebでの使い方

2023/9/26
LLM 有料記事画像認識論文

OpenAI、ChatGPTが画像を分析する『GPT-4V（ビジョン）』を発表。安全性、嗜好性、福祉機能を強化

OpenAI、ChatGPTが画像を分析する『GPT-4V（ビジョン）』を発表。安全性、嗜好性、福祉機能を強化

2023/9/5
OCR 有料記事画像認識論文

数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』

ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする

ロボットが「初めて見る環境」で「初めて聞く指示」に対しても行動をとれるようにする

2023/7/27
有料記事画像認識自動運転論文

未知の物体を認識し、それを既知の物体と区別する新たな研究　BMWやGoogleなど

未知の物体を認識し、それを既知の物体と区別する新たな研究　BMWやGoogleなど

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

おすすめポスト

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

Copyright © AIDB All rights reserved.