次回の更新記事：AIコーディングエージェントのコスト構造を読み解く（公開予定日：2026年05月26日）

記事一覧

投稿の記事一覧が表示されるページです。

視線誘導の謎を解く：シーン理解を最適化する視覚言語モデルの創発的な人間的注視パターン

2026.05.25

一文から一幕劇を生成：マルチエージェントシステムによるパーソナライズされたショートドラマ制作

2026.05.22

AIは第一印象を超えて性格を理解できるか？～知覚か、偏見か～

2026.05.22

ProCrit：批評家による修正誘導で多角的推論を自己生成するマルチモーダル皮肉検出

2026.05.22

感情の階層構造を捉える：マルチモーダル感情認識のための階層的双曲線RAG

2026.05.22

MementoGUI：長期間タスク向けエージェント型マルチモーダル記憶制御を学習する

2026.05.22

デジタル実体のための非衝突生体認証：幾何学、容量、および百万規模の仮想IDプロビジョニング

2026.05.22

深層事前アライメントによるマルチモーダル理解の深化

2026.05.22

エゴセントリック調理動画を実行可能な世界に変換し、信念状態プランニングを実現する「Ego2World」

2026.05.16

個人の視覚的文脈を学習する大規模マルチモーダルモデル

2026.05.16

キャラクター視点で世界を見る：マルチモーダルRPGエージェントの役割干渉を解決する

2026.05.16

視線制御による能動的視覚でマルチモーダル推論を革新するGazeVLM

2026.05.16

BabelDOC：中間表現でレイアウトを保つPDF翻訳を改善

2026.05.16

骨格ベース行動認識のための概念駆動型論理推論ニューロシンボリックフレームワーク

2026.05.16

人間が見る環境を大規模言語モデルで定量化し、メンタルヘルスとの関連を解明

2026.05.09

人間のように連続的な動きを捉える統合エンコーダー「OmniEncoder」

2026.05.09

学習者のエンゲージメントをセンサで計測する「EduGage」：自己学習動画における瞬間評価の手法とデータセット

2026.05.09

BlenderRAG：検索拡張コード合成による高忠実度3Dオブジェクト生成

2026.05.08

文脈を事前情報に：猫をテストベッドとした非言語エージェントの意図推論

2026.05.02

CADプログラムをAIが自律生成：実データなしで100万件規模の解釈可能なCADデータセットを構築

2026.05.02

Copyright © Parks, Inc. All rights reserved.