LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

「HTMLをそのままLLMに入力してはどうか」という新しいアプローチ

本記事では、LLMの精度向上のために用い...
Read More

LLMの機能別「領域」はまるで脳のようであるとの仮説

本記事では、LLMの内部で発見された驚く...
Read More

OCR

JPモルガンの研究者らは、企業のドキュメントをLLMで読み込むモデル『DocLLM』を発表しました。
GoogleがLLMで「非構造化文書」高精度テキスト抽出するOCR『LMDX』発表
数式や文章がぐにゃぐにゃに曲がった論文PDFでもくっきり認識する画期的なOCR『Nougat』
Apple、3万文字の「手書き漢字」認識するAI技術を開発(論文)【AI×社会】
世界の言葉はデジタル保存されていく。ウルドゥー語編(AI×都市)【論文】
インクの質感までAI生成できるか。新鋭”DocCreator”(AI×OCR)【論文】
すべての言語はデジタル化できるのか。難読言語のOCRが開発中(AI×アート)【論文】
動画中から”難関”アラビア語の抽出なるか(AI×エンタメ)【論文】
PAGE TOP