最新の記事:科学は「研究」と「査読」両方が加速していく AIと…
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

バイトダンスの研究者が「大規模言語モデル(LLM)のMBTI性格特性はプロンプトで調整可能」と示唆

2023.08.03
深堀り解説

本記事では、大言模言語モデル(LLM)が人間のような性格を持つかどうかを探求する最新の研究を紹介します。人間の性格を評価するための一般的なツールであるマイヤーズ・ブリッグス・タイプ指標(MBTI)を用いて、LLMの「性格」を評価することを試みた研究です。

研究を行ったのはTikTokなどを運営するByteDance社の研究者らです。

参照論文情報

関連研究

LLMは性格を持つのか?変えられるのか?

本研究では、大規模言語モデル(LLM)が人間のような性格を持つかどうかを探求しました。その手法として、人間の性格を評価するための一般的なツールであるマイヤーズ・ブリッグス・タイプ指標(MBTI)を用いて、LLMの性格を評価しました。この評価は、MBTIの93の選択肢からなる質問に対するLLMの回答を分析することで行われました。

研究者らは、LLMが多様な性格を示すことを発見しました。そして、適切なチューニングを行うことで、性格を変更することが可能であることが示されました。

技術と手法の要点

性格評価のためのMBTIの活用

研究者らは、MBTIを用いてLLMの性格を評価しました。MBTIは、人間の性格を評価するための一般的なツールであり、エクストラバージョン/イントロバージョン(E/I)、センシング/イントュイション(S/N)、思考/感情(T/F)、判断/知覚(J/P)の4つの二元的な性格指標を用いて、16種類の性格タイプを定義します。これらの性格タイプは、個々の強み、弱み、コミュニケーションスタイルを示し、ビジネス、教育、個人開発の分野で広く使用されています。

研究者らは、MBTIの93の選択肢からなる質問に対するLLMの回答を分析しました。最終的なトークンの確率値を分析し、最も高い確率を持つ選択肢をモデルの回答として選びました。その後、各指標を4つのグループ(E-I/S-N/T-F/J-P)に分類し、各グループ内で最も高いスコアを持つものをそのグループの決定的な回答としました。

LLMの評価

LLMの知識を評価するために、研究者らは複数の選択肢からなる質問の正確さを計算するいくつかの指標を用いました。これには、CommonsenseQA(一般的な常識に関する質問)、HellaSwag(一般的な常識に関する推論)、MMLU(57のタスクをカバーするテスト)、C-Eval(多様な分野と難易度レベルをカバーする包括的な中国語評価スイート)などが含まれます。

この手法の検証結果

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能
  • プロンプト管理ツールの利用

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に
  • プロンプト管理ツールの無制限使用

記事検索

年/月/日
年/月/日

関連記事