Claude 3などのLLMはコンテキスト内学習によって線形回帰・非線形回帰問題タスクもこなす

■無料で入れる新コミュニティ発足のお知らせ

---以下、記事本文---

Claude 3などのLLMはコンテキスト内学習によって線形回帰・非線形回帰問題タスクもこなす

GPT-4やClaude 3といった最先端の性能を持つLLMが、回帰問題をどれほど解けるのかが調査されました。

実験の結果、LLMは、回帰問題タスクに特化した機械学習モデルに匹敵する性能を発揮しました。
LLMに対しては回帰問題の解き方を細かく教えたのではなく、問題と答えの例をいくつか見せただけ（Few-Shotのコンテキスト内学習）でした。

なお回帰問題とは、一連の入力に対して傾向を予測する統計的手法です。直線で表せるものを線形回帰、曲線で表すものを非線形回帰と言います。

参照論文情報

タイトル：From Words to Numbers: Your Large Language Model Is Secretly A Capable Regressor When Given In-Context Examples

著者：Robert Vacareanu, Vlad-Andrei Negru, Vasile Suciu, Mihai Surdeanu

所属：University of Arizona, Technical University of Cluj-Napoca

背景

LLMの「コンテキスト内学習」と呼ばれる能力に注目が集まっています。少ない例（コンテキスト）から新しいタスクを学習する能力のことを指します。

多くの研究者が、このコンテキスト内学習の仕組みを解明しようと研究を進めています。その中で、コンテキスト内学習と機械学習の基本アルゴリズムとの関係を探る研究も盛んです。理論的には、LLMがコンテキスト内学習で、例えば勾配降下法（機械学習の基本アルゴリズムの一種）を近似的に実装できることは示されているのですが、実際のLLMがそのような振る舞いをしているかどうかは議論の余地があり明らかにはされていません。

また、コンテキスト内学習の性能を評価する研究も行われています。例えば、例が増えるにつれてLLMの予測がどう改善されるか、どのようなタイプの関数をLLMが学習できるかなどが調べられています。

これまでの研究の多くは、シンプルなモデルや、タスク専用に学習されたモデルを使ったものでした。事前学習済みのLLMを使って、実践的なタスクにおけるコンテキスト内学習の性能を評価した研究はあまりありません。

そこで今回、研究者らは事前学習済みのLLM（GPT-4やClaude 3など）を使って、回帰問題におけるコンテキスト内学習の性能を評価することにしました。