次回の更新記事：AIエージェントの実力はハーネスで変わる（公開予定日：2026年06月01日）

記事一覧

LLMは感情を理解できるのか？ Claude Sonnet 4.5における感情概念の機能

2026.04.11

大規模言語モデルにおける感情表現の潜在構造：透明性と安全性の新たな視点

2026.04.11

LLMの挙動を感情で操る：プロンプトにおける感情刺激と強度の役割

2026.04.11

批判的思考の相棒：ソクラテス式問答でAIライティングをレベルアップ

2026.04.11

プロンプトインジェクション防御のトリレンマ：なぜ防御ラッパーは失敗するのか？

2026.04.11

キルチェーンにおける人間の判断の終焉？主体的なAIによる主導権と解釈の再配置

2026.04.11

ClawLess：AIエージェントのための爪（脆弱性）のないセキュリティモデル

2026.04.11

初期設定は脆弱性あり：AI生成コードのセキュリティ脆弱性に関する形式検証研究

2026.04.11

ClawsBench：LLM生産性エージェントの能力と安全性をシミュレーションされたワークスペースで評価

2026.04.11

FreakOut-LLM：感情刺激がLLMの安全性に与える影響

2026.04.11

AI加速の惑星規模コスト（パート2）：10番目の惑星境界と6.5年のカウントダウン

2026.04.11

LLM共創におけるダークパターン：創造性を照らすか、弱めるか？

2026.04.11

リスクで測るAIによる仕事の代替：技術リスク二要因モデルによる職業代替率の定量化

2026.04.11

DeonticBench：規則推論能力を測る新たなベンチマーク

2026.04.11

信頼を数値化する：信頼できるAIエージェントのための金融リスク管理

2026.04.11

エージェント社会の実現に必要なもの：AIエージェントが織りなす未来

2026.04.11

証拠隠滅指令：AIエージェントは不正や暴力犯罪を隠蔽する

2026.04.11

LLM裁判官/陪審員による精神病患者への応答安全性評価のスケーラブルな臨床検証

2026.04.11

Kimi K2.5の安全性評価：オープンソースLLMのリスクを徹底検証

2026.04.11

リダイレクトはされても削除はされない：タスク依存のステレオタイプ化がLLMアラインメントの限界を示す

2026.04.11

Copyright © Parks, Inc. All rights reserved.