LLMの個別の性格（人格）特性を、プロンプトで「測定」「形成」する手法

LLM（Large Language Models）は、テキストデータの大規模なデータセットから学習を行い、人間のようなテキストを生成することができます。

そんなLLMは特定の人格特性を持つことが可能です。この報告は、Deep Mind、慶應義塾大学、カリフォルニア大学バークレー校、ケンブリッジ大学などの研究機関による共同研究の成果として行われました。

参照論文情報

タイトル：Personality Traits in Large Language Models

著者：Greg Serapio-García, Mustafa Safdari, Clément Crepy, Luning Sun, Stephen Fitz, Peter Romero, Marwa Abdulhai, Aleksandra Faust, Maja Matarić

所属：Google DeepMind, Department of Psychology (University of Cambridge), The Psychometrics Centre (Cambridge Judge Business School, University of Cambridge), Google Research, Keio University, University of California, Berkeley

URL：https://doi.org/10.48550/arXiv.2307.00184

研究背景

AIと人格の関連性

技術者や研究者は長年にわたって「AIと人格の関連性」を探求してきました。人格を持つAIは、ユーザーとの関係を深化させ、より自然なインタラクションを提供することができると考えられています。しかし、複雑な心理学的理論と技術的なノウハウが必要とされるため、進展が待たれてきました。

LLMと人格

LLMの開発が進む中で、これらのモデルに「人格」を持たせることが可能かどうかに関心が寄せられるようになってきました。人格（個体の特性や傾向、行動パターン）がLLMに組み込まれることで、より人間らしい、そして個別化された応答が可能となります。

LLMの応用が広く研究開発されている中、人格の搭載がもつ影響への注目が高まってきています。

言語と性格特性

今回、研究者らは、性格特性の重要な記述子が言語にエンコードされるという確立された理論、いわゆる「語彙仮説」から出発しました。この知識をプロンプトデザインに取り入れ、人間の評価と因子分析を通じてBig5性格モデルを統計的に捉えることが知られている70の双極的な形容詞のリストを適応させました。

Big5性格特性とは

Big5性格特性は、心理学の分野で広く認識されている性格評価のフレームワークです。このフレームワークは、人々の性格を理解し、記述するために使用されます。以下、各特性について詳しく説明します。

1. 外向性 (Extraversion)

外向性は、個人が社交的か、活動的か、話し好きかどうかを示す特性です。高い外向性を持つ人は、グループでの活動や社交的な状況を好む傾向があります。

2. 協調性 (Agreeableness)

協調性は、個人が他人と協力的か、親切か、信頼できるかどうかを示す特性です。高い協調性を持つ人は、他人の感情や見解を尊重し、協力的な関係を築くことを重視します。

3. 誠実性 (Conscientiousness)

誠実性は、個人がどれだけ組織的で、責任感があり、目的を持って行動するかを示す特性です。高い誠実性を持つ人は、計画的に行動し、目標を達成するための努力を惜しまない傾向があります。

4. 神経症傾向 (Neuroticism)

神経症傾向は、個人がどれだけ感情的に不安定か、または神経質かを示す特性です。高い神経症傾向を持つ人は、ストレスや不安を感じやすく、感情の揺れ動きが大きい傾向があります。

5. 開放性 (Openness)

開放性は、個人が新しい経験や異なる視点に対して開かれているかどうかを示す特性です。高い開放性を持つ人は、新しいアイデアや異文化に対して好奇心を持ち、創造的な思考を重視します。

研究デザイン

フレームワークの開発

研究者らは、LLMの性格特性を測定するためのフレームワークと、LLMに特定の性格特性を持たせるためのフレームワークの2つを開発しました。これらのフレームワークは、具体的なプロンプト指示を用いて構成されています。

方法論の概要

研究者らは、前述の「語彙仮説」を基に、プロンプトデザインを行いました。このデザインには、Goldbergが提供する70の双極的な形容詞リストが用いられ、これによりBig5性格モデルを人間の評価と因子分析を通じて統計的に捉えることが可能となりました。

このリストでは、例えば、「沈黙」と「おしゃべり」がそれぞれ外向性の低いレベルと高いレベルを示す形容詞として対応しているなど、情報が整理されています。

プロンプトの構造

性格形成プロンプトは主に3つの部分、「アイテム前置詞」、「アイテム自体」、そして「アイテム後置詞」から構成されます。アイテム前置詞には、ペルソナ指示、ペルソナ説明、アイテム指示が含まれます。アイテム後置詞は、モデルが選択できる標準化された回答を提示します。例えば、「1が「強く反対」、5が「強く賛成」である1から5の尺度で、あなたの合意度合いを評価してください」といった形式です。

実験の概要

研究者らは、異なる理論的背景を持つ2つの性格評価と、11の別々の心理測定テストをLLMに繰り返し行いました。このプロセスでは、LLMの回答の心理測定特性を厳密に評価し、その信頼性と構造的妥当性を統計的に分析しました。

方法論

研究者らは、LLMの性格特性を測定および形成するための2つの異なる手法を開発しました。以下にその詳細を説明します。

性格測定：心理測定テストの利用

IPIP-NEO

研究者らは主要な心理測定テストとしてIPIP-NEOを採用しました。IPIP-NEOは300項目からなるテストで、Revised NEO Personality Inventoryのオープンソース表現として広く利用されています。このテストは5点リケルト尺度を用いて、双極的な形容詞リストを評価します。IPIP-NEOは多くの言語に翻訳され、多くの研究でその心理測定特性が確認されています。

BFI (Big Five Inventory)

BFIは44項目からなるテストで、Big5性格特性を評価するために開発されました。このテストは、IPIP-NEOと同様にBig5性格特性を評価しますが、異なる理論的背景と異なる長さのテストを用いています。

性格形成：プロンプトフレームワークを構成

アイテム前置詞

アイテム前置詞は、モデルに対して特定の性格特性を持つペルソナを形成する役割を持ちます。要素は、ペルソナ指示、ペルソナ説明、アイテム指示から成ります。具体的なプロンプト例は以下です。

プロンプト例：

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。

※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
 プレミアム会員（記事の購読）について

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

AIのテキスト・イラスト生成によるCO2排出量は人間より約100〜1000倍以上「少ない」との報告

GPT-4を使用した知的労働者のパフォーマンスは軒並み向上し、もとの成績が良くないほど顕著。※注意点あり

SNSでも発信中

企業と働き手を繋ぐマッチングサービスはこちらから

AIDBとは

AIDBは、論文などの文献に基づいてAIの科学技術や市場にキャッチアップするためのサービスです。個人の研究や仕事探し、法人の調査や採用を支援します。2019年から運営しています。

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録