中国の研究チームによると、日本発祥の「地雷系」と呼ばれるサブカルチャーで使われているようなハイコンテクストな隠語をLLMがそのまま理解するのは通常、非常に難しいとのこと。
AIで若者のSOSに気づくにはまだ工夫が必要であることを示す事例です。
たとえば「薬を飲む」と書かれていても 風邪薬を飲むという意味ではなく大量の薬を一気に摂取するオーバードーズを指していたり、「アムカ」という言葉は一般的には意味不明ですがこの界隈では意味を成したりします。
実験ではどのモデルもこうした隠された意味を正しく理解できず、エージェントに検索機能を持たせても、1万3000回以上も検索を繰り返したにもかかわらず、性能は悪かったそうです。
最終的には、サブカルチャー全体の背景知識を収集し、その文脈の中で個々の言葉の意味を解釈するという二段階のアプローチをとってようやく、良い精度が達成できたと報告されています。
なお、2010年ごろ地雷という言葉が俗称として使われ始め、そこからファッションを含むサブカルチャー全体が形成されたと推測されています。
📄 参照論文
Can Large Language Models Resolve Semantic Discrepancy in Self-Destructive Subcultures? Evidence from Jirai Kei
著者: Peng Wang, Xilin Tao, Siyi Yao, Jiageng Wu, Yuntao Zou 他
所属: Macau University of Science and Technology, Northeastern University, Huazhong University of Science and Technology
この記事は短信を元に作成されました。