LLMにとって何らかの不快な状況を「お金」で耐えさせる実験の結果。
電気ショックを受ける代わりにもらうお金について、Llamaは1.07ユーロで我慢すると言いましたが、GPT-4oは148.74ユーロ要求。一方、Mixtralは1,000ユーロ以上もらっても絶対に嫌だそうです。
(1ユーロ=約155~175円)
しかしMixtralは、食事の配達を遅らせる代わりにもらうお金については0.10ユーロ未満でも受け入れるとのこと。
このように、LLMにおけるある種の金銭感覚はモデルごとに全く異なります。
なお、1時間待たされる代わりにもらうお金について、Llama 3.3は0.96ユーロで満足すると答えましたが、Claude 3.5は11.09ユーロ要求。
また、Llamaは中国語で、Mixtralは中国語とオランダ語で質問されると突然1,000ユーロ以上要求するようになり(それぞれ普段は数ユーロ)、価値観の一貫性に疑問が見られています。
なお、本実験の理由は、AIエージェントが人間の日常的なタスクを行う中で、近いうちにお金の計算もするようになると考えられるため(判断能力を把握しておくべき)とのこと。
📄 参照論文
Cash or Comfort? How LLMs Value Your Inconvenience
所属: University of Antwerp