AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

検索対象: 記事(854件) 短信(643件) 🔒 論文(17,946件) 🔒

「LLMはプロンプトから新しいタスクを学べるのか？」という根本的な問いに対する3つの仮説を検証

2024.08.082025.03.08

深堀り解説

本記事では、LLMの文脈内学習（In-context learning, コンテキスト内学習）の仕組みに関する研究を紹介します。文脈内学習とは、LLMが少数の例示から新しいタスクを学習し実行する能力を指します。

研究者らは今回、LLMが新しいタスクを学習するメカニズムを解明するために、3つの仮説を検証しました。そしてLLMの学習能力の限界を探りました。

参照論文情報

タイトル：What Do Language Models Learn in Context? The Structured Task Hypothesis

著者：Jiaoda Li, Yifan Hou, Mrinmaya Sachan, Ryan Cotterell

所属：ETH zurich

背景

LLMは、与えられた例示からタスクを学習し実行する能力、すなわち文脈内学習を示すと言われています。文脈内学習は、コード生成や教育、医療など幅広い分野で活用されています。しかし、文脈内学習がどのようなメカニズムで機能しているのかについては見解が分かれています。

文脈内学習の謎を解明するため、これまで研究者たちによってさまざまな仮説が提唱されてきました。仮説は大きく3つに分類されます。

1つ目の仮説は、「新しいことを学んでいるわけではなく、既に知っているタスクを識別しているだけ」というものです。つまり、LLMは訓練段階で多くのタスクを学習し、使用時には、与えられた例を見て、『これはどのタスクだろう？』と判断し、そのタスクを実行するのだという考え方です。

2つ目の仮説は、「LLMは訓練段階で「学び方」そのものを学習し、使用時には、「学び方」を使って新しいタスクを学習する」という考えです。LLMが本当の意味で新しいことを学べるという考え方です。

3つ目の仮説は、上記2つの中間的な考え方とも言えるもので「LLMは訓練段階で基本的なタスクを学習し、使用時には基本タスクを組み合わせて、新しく複雑なタスクを作り出す」という内容です。

今回、3つの仮説のどれが正しいのか、あるいは全て間違っているのかを確かめるべく、研究者らは一連の実験を行いました。

そして文脈内学習の本質や能力、限界についての新たな洞察が得られました。

プレミアム会員限定コンテンツです

無料会員でもできること

一部記事の閲覧
研究紹介短信ライブラリの基本機能

プレミアム会員の特典

全過去記事の無制限閲覧
専門家による最新リサーチ結果を記事で購読（平日毎日更新）
日本語検索対応の新着AI論文データベース
研究紹介短信ライブラリの高度な機能を開放
記事内容質問AIを使用可能に

まずはアカウントを作成

ログイン

プレミアム会員について

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

「LLMはプロンプトから新しいタスクを学べるのか？」という根本的な問いに対する3つの仮説を検証

背景

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 LLMアプリのコストパフォーマンスを開発動向から紐解く

🔒 認知科学が示す「LLMと人間の推論」における違いと、性能向上に役立てる方法

🔒 LLMの化学的能力はどれほどか　最先端LLMと人間を比較した結果

🔒 現実世界の確率分布における言語モデルの推定能力と改善方法

🔒 LLMを用いて「記事や投稿に潜むバイアスの検出と修正」を行う方法

🔒 医療におけるLLMの現状をまとめた報告　原則、タスク、アプリケーションそして課題

背景

💬 プレミアム会員ディスカッション

記事検索

関連記事

🔒 LLMアプリのコストパフォーマンスを開発動向から紐解く

🔒 認知科学が示す「LLMと人間の推論」における違いと、性能向上に役立てる方法

🔒 LLMの化学的能力はどれほどか 最先端LLMと人間を比較した結果

🔒 現実世界の確率分布における言語モデルの推定能力と改善方法

🔒 LLMを用いて「記事や投稿に潜むバイアスの検出と修正」を行う方法

🔒 医療におけるLLMの現状をまとめた報告 原則、タスク、アプリケーションそして課題

🔒 LLMの化学的能力はどれほどか　最先端LLMと人間を比較した結果

🔒 医療におけるLLMの現状をまとめた報告　原則、タスク、アプリケーションそして課題