AIDB
menu
AIDBとは
アカウント作成
ログイン
ホーム
画像認識
次回の更新記事:
会議出席代行システム LLMでどこまでできるか
(公開予定日:2025年02月25日)
コンテンツ検索
Search for:
LLM
エージェント
論文
LLM科学者と人間の協力で実験の効率化 Googleなど
By AIDB Research
/ 2025/02/20
本記事では、LLMを活用した科学実験の進...
Read More
LLM
論文
100万ドル分のソフトウェアエンジニアリング業務に挑む
By AIDB Research
/ 2025/02/20
LLMがめざましく高度化しているにもかか...
Read More
LLM
政治・社会
論文
「LLM活用で文書作成」社会でどこまで導入されている
By AIDB Research
/ 2025/02/19
本記事では、LLMが社会のさまざまな分野...
Read More
LLM
論文
LLMを擬人化することに対する見解
By AIDB Research
/ 2025/02/18
本記事では、LLMを「人間らしいもの」と...
Read More
LLM
論文
LLM専用の「新しい言葉」を導入 Google DeepMind
By AIDB Research
/ 2025/02/17
本記事では、LLMの理解と制御に向けて新...
Read More
お知らせ
AIDBプレミアム会員特典のお知らせ
By AIDB Research
/ 2025/02/15
情報収集と学習を継続されている皆さまに対...
Read More
LLM
エージェント
論文
「すべてのソフトウェアをエージェントとして使う」ビジョンと実践例
By AIDB Research
/ 2025/02/14
ソフトウェアを自然言語で操作する新しい手...
Read More
LLM
ベンチマーク
論文
天井が見え始めたこれまでのLLMベンチマークを超える究極の問題集 DeepSeek-R1もテスト
By AIDB Research
/ 2025/02/13
LLMの性能は日々進化を続けています。そ...
Read More
LLM
政治・社会
論文
「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査
By AIDB Research
/ 2025/02/12
これまで広い視野での「LLMによる仕事の...
Read More
クイズ
o3-miniクイズ
By AIDB Research
/ 2025/02/11
*前回はDeepSeekについてのクイズ...
Read More
画像認識
2024/11/26
LLM
オープンソース
推論モデル
画像認識
論文
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)
2024/10/9
画像生成
画像認識
論文
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
高解像度な深度マップを高速生成するモデル『Depth Pro』Appleが公開
2024/8/7
画像認識
論文
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
漫画を台本に変換するモデル『Magi v2』オックスフォード大学の研究グループが開発
2024/8/2
画像認識
論文
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
画像と「動画」の中にあるものを認識する『SAM 2(Segment Anything 2)』をMetaが開発
2024/6/25
LLM
プロンプト
画像認識
論文
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
タスクを一度視覚化して取り組ませることで、LLMの推論能力を大きく向上させるプロンプト手法『Whiteboard-of-Thought(ホワイトボード思考法)』
2024/4/4
LLM
画像認識
論文
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
2024/1/8
LLM
OCR
ニュース
画像認識
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
2023/12/29
LLM
ニュース
画像生成
画像認識
音声
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。
2023/12/11
LLM
画像認識
論文
「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル(LVM)を構築するアプローチを開発
「視覚は本来、言語に依存しない」と考えた研究者らが、言語データなしで大規模ビジョンモデル(LVM)を構築するアプローチを開発
2023/10/11
LLM
オープンソース
画像認識
論文
画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
画像分析機能を持つオープンソースLLM『LLaVA-1.5』登場。手持ちの画像を分析可能。GPT-4Vとの違い
1
2
3
4
>
コンテンツ検索
検索:
31820
直近1ヶ月で読まれている記事
LLM専用の「新しい言葉」を導入 Google DeepMind
GPT-4とヒューマノイドロボットを連携すると何が起こるか。東京大学と株式会社オルタナティヴ・マシンの研究者らが実験
DeepSeek R1が実現した教師なし強化学習による推論性能の向上
LLMの定理証明力を2倍に向上させる「予想と証明を繰り返させる」手法 限られたデータの中で
「職業別にみるLLM活用の現状と今後」Anthropicが大規模調査
PAGE TOP
Copyright ©
AIDB
All rights reserved.