AIDB Daily Papers
LLMで話声から心理的幸福度を予測する研究
※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。
ポイント
- 大規模言語モデル(LLM)を用いて、自然な会話音声から心理的幸福度(PWB)をゼロショットで予測する手法を開発した。
- 臨床心理学と音声学の専門家と協力して開発したプロンプトにより、LLMが音声から意味のある手がかりを抽出できることを示した。
- 最大0.8の相関を達成し、予測のばらつきやバイアス、特徴的な言語表現を分析することで説明性を高めた。
Abstract
We investigate the use of Large Language Models (LLMs) for zero-shot prediction of Ryff Psychological Well-Being (PWB) scores from spontaneous speech. Using a few minutes of voice recordings from 111 participants in the PsyVoiD database, we evaluated 12 instruction-tuned LLMs, including Llama-3 (8B, 70B), Ministral, Mistral, Gemma-2-9B, Gemma-3 (1B, 4B, 27B), Phi-4, DeepSeek (Qwen and Llama), and QwQ-Preview. A domain-informed prompt was developed in collaboration with experts in clinical psychology and linguistics. Results show that LLMs can extract semantically meaningful cues from spontaneous speech, achieving Spearman correlations of up to 0.8 on 80% of the data. Additionally, to enhance explainability, we conducted statistical analyses to characterise prediction variability and systematic biases, alongside keyword-based word cloud analyses to highlight the linguistic features driving the models' predictions.
Paper AI Chat
この論文のPDF全文を対象にAIに質問できます。
質問の例: