量子化はLLMの性能にどう影響を与えるか?モデルが持つ「自信」の観点から説明

LLMは多大な計算コストとメモリーを必要...
Read More

LLMでWikipediaのような文書を作成する方法「STORM」スタンフォード大学研究者ら開発

スタンフォード大学の研究グループが提案し...
Read More

Appleが開発 スマホに特化したマルチモーダルLLM『Ferret UI』

「スマホ画面上のオブジェクトを理解するの...
Read More

画像認識

マルチモーダルLLMにおける欠点と原因を明らかにする調査研究の結果
Appleが開発 スマホに特化したマルチモーダルLLM『Ferret UI』
マルチモーダルLLMに心の目を与える『Visualization-of-Thought』プロンプティングが空間推論タスク性能を向上させる
Appleが開発、スマホのスクリーンを理解してユーザーと対話できる『ReALM』端末上で動く軽量モデル
GPT-4Vで画像分析する際、画像に「ドットマトリックス」を重ねるだけで認識精度が大きく向上
マルチモーダルLLMの技術や開発トレンド、26種類のモデル例を網羅的にまとめた報告
JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
視覚・テキスト・音声そして行動データを処理するマルチモーダルLLM「Unified-IO 2」を開発したと報告されています。

業界/カテゴリー

PAGE TOP