Gemini-1.5-proやGPT-4o-miniなどの性能を上回るLLaVA-o1(11Bパラメータ)

本記事では、視覚と言語を組み合わせたマル...
Read More

LLMによるバグ全自動修正に成功するケースと失敗するケースの違い

本記事では、LLMによるバグ修正に関する...
Read More

LLMが長々と説明するときは自信がない傾向にある 14個のモデルで検証

本記事では、LLMが「答えに自信がない時...
Read More

LLMプロジェクト開発に必要な新しい概念「AgentOps」とは

本記事では、LLMエージェントを安全に開...
Read More

画像も文字も表も全部まとめて理解するRAGシステムの提案 Bloombergなど

本記事では、複数の文書やページから図や表...
Read More

LLMにおける長文処理能力の進化を調査 Claude 3.5は情報の流れを追跡するスキルに長ける

本記事では、LLMの長文処理能力について...
Read More

2次元の画像に対し「光の当たり加減」変えるAI手法が公開【GitHub】
企業の財務諸表に対する「監査AI」作ってみた(AI×金融)【論文】
Google、物体を追跡してから検出するAI技術発表【CVPR2020】
AIにポルノを観させ、カテゴリ分類させる実験が行われた(AI×社会)【論文】
「13」もあるインド系言語に対応するAIライブラリが公開【GitHub】
特許「AlexaやGoogleアシスタントからの着信を見破るAI」出願が公開(米PINDROP SECURITY社)
AIによって顔写真からそっくりな似顔絵を描くフレームワーク登場!【GitHub】
スタンフォード大、「透明」でも3D姿勢を推定できるAI技術発表【CVPR2020】
PAGE TOP