「LLMが自信満々に間違う」のは、モデル全体がぼんやりそうなっているのではなく、かなり限られた内部メカニズムが原因らしく、そこを狙えば直せるかもしれないとの報告。
LLMは、間違った答えを出したときでも「自信ありげ」に見せてしまうことが多いです。
ユーザーとしては振り回されることも多く、指示の出し方を工夫して改善しようと奮闘したり、あるいは諦めて付き合ったり、AI相手に怒ったりしています。
しかし今回バージニア大学の研究者らは、AIに実際以上に高い自信を出させている内部回路を特定し、そこに小さく介入するだけで、正しさに見合った自己評価を出せるようになることを示しました。
こうした発見が一般ユーザーに役立つには少し時間がかかる場合も多いですが、ともかく研究は前進しています。