大規模言語モデル(LLM)はテキスト生成や推論能力の面で飛躍的な進歩を遂げています。LLMは理論的な問題解決において優れた能力を示しており、さまざまな領域で活用が進んでいます。
一方で、LLMの「人間の感情への共感や理解」に関してはまだ進歩の余地があります。そこで、ソウル国立大学の研究チームは、「CoE:Chain of Empathy(共感の連鎖)」プロンプト手法を開発しました。
CoE手法は、心理療法の理論に基づき、LLMに対してより深い共感力と感情理解を促すよう設計されています。特定のプロンプトテンプレートを使用することで、LLMがユーザーの感情を識別し、共感的かつ理解のある反応を示すようになるとされています。
本記事では、CoEプロンプト手法の研究背景、理論基盤、性能評価結果、および実行方法に焦点を当てて論文を紹介します。
なお、本手法を実装したMyGPT(カスタマイズされたChatGPT)をAIDBで作成してみました。記事の最後にリンクを置いておくので、ぜひ試してみてくださいね。
参照論文情報
- タイトル:Chain of Empathy: Enhancing Empathetic Response of Large Language Models Based on Psychotherapy Models
- 著者:Yoon Kyung Lee, Inju Lee, Minjung Shin, Seoyeon Bae, Sowon Hahn
- 所属:Human Factors Psychology Lab, Seoul National University
- URL:https://doi.org/10.48550/arXiv.2311.04915
本記事の関連研究:GPT-4をセラピストとして実行し、「認知の歪み」を診断させるためのフレームワーク『Diagnosis of Thought (DoT)』と実行プロンプト
背景
大規模言語モデルと感情理解
LLMは、人間の表現に近いテキスト生成や様々な問題解決タスクでの推論能力を示しており、例えば法律や数学、医療などの分野で高いパフォーマンスを示しています。しかし、これらの成功の一方で、感情やその背後にある原因について推論し、ユーザーの入力に共感的な反応を示すことは、まだまだ未開拓の領域であり、さらなる探求が必要とされています。
共感的理解は、他者の心理状態に対する認知的な推論を必要とします。共感的な理解をロジカルに行う方法としては、心理療法のアプローチがあります。そのため、心理療法のアプローチをLLMに活用することで、モデルの共感的反応の精度を高めることが可能かもしれません。
そもそも、人間とAIのコミュニケーションにおいて感情を理解することの重要性が増してきており、より人間らしい対話を実現するための進歩が求められています。
感情的なコミュニケーションの挑戦
テキストベースのコミュニケーションでは、特に感情的なコンテキスト(文脈)を理解し反映することが重要です。しかし、現在のAIにとっては、個別化された反応を生み出すことは依然として大きな課題です。
さまざまな研究機関によって、人間らしい特性を取り入れて共感表現能力を高めるための取り組みが進んでいます。
この背景を踏まえ、ソウル国立大学の研究チームは、「Chain of Empathy」を開発し、LLMの感情理解能力を高めるための新たなアプローチを提案しています。LLMが人間の感情状態をより深く理解し、より共感的な対応をすることを目的とした研究です。
本記事の関連研究:「心の理論」においてGPT-3は人間の3歳、GPT-4は人間の7歳(基本の概念を理解しているレベル)に相当するとの研究報告
CoEプロンプトの参考になっている心理療法理論
「Chain of Empathy」が参考にしている心理療法の理論について掘り下げます。
Cognitive-Behavioral Therapy(CBT)
CBTは、認知行動療法としても知られ、思考、感情、行動の相互関係に焦点を当てています。ネガティブな思考パターンを特定し、それらをより現実的で健康的なものに再構築することを目指す理論です。
この理論をプロンプトで指示すると、LLMがユーザーの感情を識別し、それに基づいた具体的な対応を生成します。ユーザーの認知的な誤りを指摘し、よりバランスの取れた共感的反応を導き出す機能があります。
Dialectical Behavior Therapy(DBT)
DBTは、感情の調節や対人関係スキル、ストレス耐性、マインドフルネスに重点を置いています。この療法は、特に情緒的に不安定な個人に対して有効とされています。
LLMはDBTに基づくCoEプロンプトを使用すると、ユーザーの感情的な調節をサポートし、感情的な反応を探究することを目指します。
Person-Centered Therapy(PCT)
PCTは、クライアント中心の療法とも呼ばれ、個人の自己理解と自己受容を促進することに焦点を当てています。クライアントの内面と可能性を信頼し、評価したりせず、サポートします。
LLMは、PCTに基づいて実行されると、ユーザーの自己理解を深め、経験に対する理解と受容を促進する回答や反応を生成します。
Reality Therapy(RT)
RTは、「現実療法」として知られ、個人が現実を受け入れ、現実に基づいた解決策を見出すことを支援するものです。このアプローチは、”選択理論”に基づき、個人が自分の行動に対して責任を持つことを勧めるものです。
LLMはRTに基づくプロンプトを用いると、ユーザーが現実に対処し、具体的な問題解決に向けた行動を取ることを促す出力を生成します。
以上の心理療法理論を活用すると、LLMはユーザーの感情的な状態をより深く理解し、具体的で共感的な対応を提供することが可能になります。
本記事の関連研究:XなどのSNSポストから精神状態を高精度に解析するLLM『MentalLLaMA(メンタルラマ)』
性能評価結果
手法の性能評価結果について詳しく説明します。
総合的な性能
“Chain of Empathy”(CoE)プロンプトを用いたLLMの性能は、論文によると、一定の精度を示しています。ただし、もちろん完璧ではありません。評価結果は、LLMが共感的な反応を示す一方、能力にはまだ改善の余地があることを示しています。
各心理療法モデルに基づくプロンプトの精度
CBT-CoEの精度(Accuracy)は0.319で、他のプロンプトと比べて若干低い値を示しています。
DBT-CoEとRT-CoEは、共に0.336の精度を示し、PCT-CoEも同様に0.336です。
精度(Precision)の面では、RT-CoEが最高値0.407を記録し、CBT-CoEは最低値0.463です。
再現率(Recall)では、PCT-CoEが0.372で最も高く、CBT-CoEは0.165と他のプロンプトよりも低い値を示しています。
F1スコアに関しては、PCT-CoEが0.382で最も高く、CBT-CoEは0.244です。
精度に関する考察
これらの数値から、各心理療法モデルに基づくCoEプロンプトの精度にはバリエーションがあることがわかります。感情的反応の解釈や探究においては特に改善の余地が見られました。「精度が期待するほど高くない」という見方もできますが、CoEプロンプトはLLMの共感的戦略を向上させることも確かです。
なお、CBTに基づくプロンプトは、バランスの取れた共感的振る舞いをもたらしています。
本記事の関連研究:LLMの個別の性格(人格)特性を、プロンプトで「測定」「形成」する手法
実行プロンプト例
実際にCoEを実行させるためのプロンプト例を紹介します。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。