GPT-4o、ASDの対人理解を専門家レベルで評価

2025.11.032026.01.31

医療（医療AI、診断支援、臨床応用）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

ASDの人がコミュニケーションを練習するゲームを作り、ゲーム結果からGPT-4oがプレイヤーを評価できるかを検証したところ、

GPT-4oの評価は経験豊富な臨床心理士たちの評価とほとんど同じだったそうです。

背景として、ASDの人は皮肉や冗談、遠回しな言い方などを理解するのが苦手なことが多いと考えられています。
研究チームは、そういった社会的な場面をゲーム化しました。例えば、上司が部下に皮肉を言う場面や、誰かが失礼なことを言ってしまう場面など。

その結果、GPT-4oがプレイヤーの回答を評価した際に、皮肉の理解、間接的な提案の理解、嘘の検出など、どの種類の課題でも人間の専門家と同等の評価ができていたそうです。

実際に臨床現場で使う前にはさらなる検証が必要であることには注意が必要ですが、それでもこうした「コミュニケーションの練習」においてLLMがうまく使えそうであるのは良いニュースです。

Large language models for autism: evaluating theory of mind tasks in a gamified environment

著者: Christian Poglitsch, Anna Reiss, Selina C. Wriessnegger & Johanna Pirker

所属: Graz University of Technology, Technical University of Munich

関連記事