次回の更新記事：AIエージェントに「私のこと」をテキストではなくコ…（公開予定日：2026年06月29日）

記事一覧

LLMがメンタルヘルスインフラとなる時：エンゲージメント最適化の倫理的課題

2026.05.29

生活史ナラティブを用いたコミュニティ統治シミュレーションのためのLLMベンチマーク

2026.05.29

LLMエージェントの記憶汚染を事後的に監査するフレームワーク「MemAudit」

2026.05.29

テスト時協調的自己対戦によるコードと単体テストの生成・改善フレームワーク「CoSPlay」

2026.05.29

エンタープライズAIシステムの包括的なテスト戦略：AIアシュアランス

2026.05.29

知識労働AIの評価ベンチマーク設計と報告基準

2026.05.29

AIエコシステムにおける説明責任境界の理論：AI地図の再描画

2026.05.29

LLMによる精神疾患スクリーニング：症状だけでなく証拠の重み付けパターンを分析

2026.05.29

SVR-MAD：事後確率誘導型マルチエージェント討論のためのベイズ的フレームワーク

2026.05.29

AIの信頼性を高めるための「決定的地平線」：不可能性定理を設計仕様へ

2026.05.29

小規模言語モデルエージェントのための二重時間スケール自己進化フレームワークPACE

2026.05.29

LLMエージェントはポケモンカードゲームをマスターできるか？ PTCG-Benchによる評価

2026.05.29

AIエージェントはセキュリティ脆弱性を実攻撃に転換できるか？ ExploitGymによる評価

2026.05.26

WebGameBench：ブラウザネイティブゲームでコーディングエージェントの要件からアプリケーション評価まで

2026.05.25

ウェアラブル健康データを活用し、汎用的な知能とインターフェースを目指す研究

2026.05.22

LLMを戦略ゲームのライブエージェントとして評価：プロバイダー性能、ハイブリッド分解、および時間制限リスクプレイにおける運用上のギャップ

2026.05.22

LLMはソフトウェア工学で信頼できるテストスイートを生成できるか？SWE-Mutationによる検証

2026.05.22

一文から一幕劇を生成：マルチエージェントシステムによるパーソナライズされたショートドラマ制作

2026.05.22

AIは第一印象を超えて性格を理解できるか？～知覚か、偏見か～

2026.05.22

AttuneBench：LLMの感情知能を測る対話型ベンチマーク

2026.05.22

Copyright © Parks, Inc. All rights reserved.