技術 | AIDB

menu

ホーム
技術

次回の更新記事：Cursorはソフトウェア開発を加速する？導入後の実態…（公開予定日：2025年11月11日）

技術

2024/11/26
LLM オープンソース推論モデル有料記事画像認識論文

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1（11Bパラメータ）

Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1（11Bパラメータ）

2024/10/31
LLM エンタメ・アート有料記事画像生成論文

プレイヤーの行動に応じてゲームを自動生成する技術　Googleなどが開発

プレイヤーの行動に応じてゲームを自動生成する技術　Googleなどが開発

2024/10/9
有料記事画像生成画像認識論文

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開

2024/8/7
有料記事画像認識論文

漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発

漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発

2024/8/2
有料記事画像認識論文

画像と「動画」の中にあるものを認識する『SAM 2（Segment Anything 2）』をMetaが開発

画像と「動画」の中にあるものを認識する『SAM 2（Segment Anything 2）』をMetaが開発

2024/6/25
LLM プロンプト有料記事画像認識論文

タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought（ホワイトボード思考法）』

タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought（ホワイトボード思考法）』

2024/4/4
LLM 有料記事画像認識論文

Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル

Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル

2024/1/8
LLM OCR ニュース画像認識

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。

2023/12/29
LLM ニュース画像生成画像認識音声

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。

視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。

2023/12/11
LLM 有料記事画像認識論文

「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル（LVM）を構築するアプローチを開発

「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル（LVM）を構築するアプローチを開発

2023/12/6
有料記事論文音声

Metaのリアルタイム多言語間翻訳システム『Seamless（シームレス）』は話し方のトーンや抑揚も反映

Metaのリアルタイム多言語間翻訳システム『Seamless（シームレス）』は話し方のトーンや抑揚も反映

2023/11/22
プロンプト有料記事画像生成論文

キャラを一貫して再現する画像生成メソッド『The Chosen One』

キャラを一貫して再現する画像生成メソッド『The Chosen One』

2023/11/6
有料記事論文音声

自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場

自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場

2023/10/24
LLM 有料記事画像生成論文

DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか？OpenAIが論文で発表

DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか？OpenAIが論文で発表

2023/10/20
LLM ニュース画像生成

「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか？」に対するOpenAIの論文が発表されました。

「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか？」に対するOpenAIの論文が発表されました。

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

おすすめポスト

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

Copyright © AIDB All rights reserved.