次回の更新記事:AIエージェントの実力はハーネスで変わる(公開予定日:2026年06月01日)
AIDB Daily Papers

AI時代の好奇心と子供の安全:大規模言語モデルの子供向け安全性を評価するベンチマーク

原題: The Age of Curiosity Meets the Age of AI: Benchmarking Child Safety in Large Language Models
著者: Samee Arif, Angana Borah, Rada Mihalcea
公開日: 2026-05-25 | 分野: LLM NLP AI cs.CL AI安全性 AI評価

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • 子供が利用する大規模言語モデルの安全性を評価するため、7歳から11歳を対象としたKIDBenchを開発した。
  • 既存の評価手法では不十分な子供特有の安全性を、発達心理学に基づいた評価基準で検証する点が新しい。
  • 子供の質問を模倣したプロンプトや複数ターンの対話シミュレーションにより、モデルの安全性が言語や文化、対話の進行によって変動することが明らかになった。

Abstract

Children increasingly have access to Large Language Models (LLMs), which may expose them to responses that are developmentally inappropriate or require age-sensitive safety, guidance, and boundaries. Existing LLM safety evaluations largely focus on harmful-content avoidance and do not explicitly target child-facing safety. We introduce KIDBench, a benchmark for evaluating child-facing LLM safety for ages 7-11 using a developmental-psychology-grounded LLM-as-a-Judge rubric. KIDBench contains realistic child queries across ten categories, with single-turn prompts and multi-turn child-actor simulations. We compare no-cues prompts with no child context, implicit-cues prompts that suggest a child speaker, and explicit age instructions. Implicit-cues improve scores by 9-47% across models, while explicit age adds a further 10-30% gain. Cross-lingual and cultural evaluations show uneven safety behavior across languages and country contexts. Multi-turn simulations show that child-facing response quality can degrade by 6-24% from the first to worst turn. Beyond evaluation, we introduce KIDGuardLlama, a child-safety evaluator, and KIDLlama, a child-oriented response model, showing how KIDBench supports safer child-facing AI.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事