AIDB Daily Papers
対話AIの多様な役割をユーザーテストする「PersonaKit」
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 対話AIが多様な役割を演じる際の、人間らしい発話の切り替え行動を評価するプラットフォームを開発した。
- 従来のシステムでは困難だった、リアルタイムでの発話切り替え行動の評価を、容易かつ低遅延で実現する点が重要である。
- このプラットフォームにより、8つの異なる役割を持つ対話AIの評価を通じて、次世代音声エージェントの社会言語学的行動の研究が可能となった。
Abstract
As spoken dialogue systems expand beyond traditional assistant roles to encompass diverse personas -- such as authoritative instructors, uncooperative merchants, or distracted workers -- they require distinct, human-like turn-taking behaviors to maintain psychological immersion. However, current full-duplex systems often default to a rigid, overly accommodating ``always-yield'' policy during overlapping speech, which severely undermines character consistency for non-submissive roles. Evaluating alternative, persona-specific turn-taking strategies through empirical user studies is challenging because building real-time full-duplex test environments requires substantial engineering overhead. To address this, we present PersonaKit (PK), an open-source, low-latency web platform for the rapid prototyping and evaluation of conversational agents. Using intuitive JSON configurations, researchers can define personas, specify probabilistic interruption-handling behaviors (e.g., yield, hold, bridge, or override), and automatically deploy comparative A/B surveys. Through an in-the-wild evaluation with 8 distinct personas, we demonstrate that PersonaKit provides an extensible, end-to-end framework for studying complex sociolinguistic behaviors in next-generation spoken agents.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: