LLMに「このタスク、どのくらいやる気ある?」と聞いてみると、モチベーションが高いと報告したタスクほど、実際にアウトプットの質が高くなり、応答も長くなるそうです。
また、2つのタスクから1つ選ぶ場面では高モチベーションの方を選ぶとのこと。
何度聞いてもほぼ同じで、タスクの種類ごとにきれいに差がついています。
こうしたモチベーションの構造は心理学で知られている「やりたい(興味・価値・挑戦)」と「できる(習熟度・恐怖の低さ)」の2軸で説明でき、人間のモチベーション研究とほぼ同じ枠組みで分析できると考えられています。
ただし、人間が「このタスク、AIならこのくらいのモチベーションだろう」という予測をしてもズレることが実験で分かりました。
なお、著者らは慎重で、これをもって「LLMに意識や内面がある」とは主張していません。あくまで行動レベルで「モチベーションがあるかのように振る舞っている」という立場です。
なお実験には最新バージョンではないモデルを使用している点にもやや注意。