Search for:
menu
menu
AIDBとは
論文記事一覧
アカウント作成
ログイン
ホーム
技術
次回の更新記事:
LLMの回答における「自信ありげな度合い」と「実際の…
(公開予定日:2025年06月23日)
技術
2024/11/26
LLM
オープンソース
推論モデル
有料記事
画像認識
論文
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
2024/10/31
LLM
エンタメ・アート
有料記事
画像生成
論文
プレイヤーの行動に応じてゲームを自動生成する技術 Googleなどが開発
プレイヤーの行動に応じてゲームを自動生成する技術 Googleなどが開発
2024/10/9
有料記事
画像生成
画像認識
論文
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
2024/8/7
有料記事
画像認識
論文
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
2024/8/2
有料記事
画像認識
論文
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
2024/6/25
LLM
プロンプト
有料記事
画像認識
論文
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
2024/4/4
LLM
有料記事
画像認識
論文
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
2024/1/8
LLM
OCR
ニュース
画像認識
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
2023/12/29
LLM
ニュース
画像生成
画像認識
音声
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
2023/12/11
LLM
有料記事
画像認識
論文
「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル(LVM)を構築するアプローチを開発
「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル(LVM)を構築するアプローチを開発
2023/12/6
有料記事
論文
音声
Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
Metaのリアルタイム多言語間翻訳システム『Seamless(シームレス)』は話し方のトーンや抑揚も反映
2023/11/22
プロンプト
有料記事
画像生成
論文
キャラを一貫して再現する画像生成メソッド『The Chosen One』
キャラを一貫して再現する画像生成メソッド『The Chosen One』
2023/11/6
有料記事
論文
音声
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
自分の話し声を別の誰かの声にリアルタイム変換するモデルが、一般消費者向けCPUで動かせる軽さで登場
2023/10/24
LLM
有料記事
画像生成
論文
DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?OpenAIが論文で発表
DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?OpenAIが論文で発表
2023/10/20
LLM
ニュース
画像生成
「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?」に対するOpenAIの論文が発表されました。
「DALL-E 3はどうしてユーザーの意図を正確に汲み取ることができるのか?」に対するOpenAIの論文が発表されました。
1
2
3
…
6
>
直近1ヶ月で読まれている記事
LLMのソフトウェア開発タスクに効くプロンプト設計の選び方 手法14種を一斉検証
LLMはなぜマルチターンの会話でつまずくのか Microsoftなどが徹底分析 ユーザーに実用的なアドバイスも
個人の深い価値観にもとづく「その人らしい答え」をAIで再現する手法
AIエージェントにおける小規模言語モデルの可能性に迫る
「RAGOps」RAGシステムを安定運用するための実践的な考え方の整理
プロフィールを登録すると
仕事のオファーが届きます
プロフィール登録
PAGE TOP
Copyright ©
AIDB
All rights reserved.