LLMは非自然言語も理解・学習可能

2025.03.09

言語・翻訳（多言語、翻訳、言語理解）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

人間だと「何これ？」と思うようなめちゃくちゃな文章（非自然言語）でも、LLMは意外と理解できることが報告されました。例えば「(alt+eqn={\\>; {};The\\,\\stock baaelkrie@nuier priceungeureau got sich last ‘# GM;;heidisation Inc. weekestig %}20% durch’)」というようなカオスな文章を与えても、LLMは「GM社の株価は先週20%変動した」と解読できるそうです。

（※実際に試しましたが、確かにこのように解読されました）

さらに面白いことに、こうした「めちゃくちゃな文章」でモデルを訓練しても、通常の文章で訓練した場合と同じくらい優秀に育つことがわかりました。

LLMが言語を処理する際、私たちが思っているよりも柔軟で、本質的な意味を捉える能力があることを示唆しています。

研究チームはシンガポール国立大学、カーネギーメロン大学、プリンストン大学、Google DeepMindに所属。

なお、この研究者らは、このような「人間にとっては理解が困難だがLLMにとっては自然言語と意味的に同等な文章」を作り出す方法を発見したとのことです。

📄 参照論文

Unnatural Languages Are Not Bugs but Features for LLMs

著者: Keyu Duan, Yiran Zhao, Zhili Feng, Jinjie Ni, Tianyu Pang 他

📎 論文を読む（doi.org）

X（Twitter）で見る

LLMは非自然言語も理解・学習可能

📄 参照論文

こちらもどうぞ

🔒 GoogleのGeminiファミリー最新モデル「Gemini 1.5 Pro」1000万トークンでほぼ完璧な検索性能

🔒 LLMにおける情報抽出（文章から必要な事柄を読み取る）タスクについての調査