最新の記事:科学は「研究」と「査読」両方が加速していく AIと…
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

「LLMはプロンプトから新しいタスクを学べるのか?」 という根本的な問いに対する3つの仮説を検証

2024.08.08
深堀り解説

本記事では、LLMの文脈内学習(In-context learning, コンテキスト内学習)の仕組みに関する研究を紹介します。文脈内学習とは、LLMが少数の例示から新しいタスクを学習し実行する能力を指します。

研究者らは今回、LLMが新しいタスクを学習するメカニズムを解明するために、3つの仮説を検証しました。そしてLLMの学習能力の限界を探りました。

参照論文情報

  • タイトル:What Do Language Models Learn in Context? The Structured Task Hypothesis
  • 著者:Jiaoda Li, Yifan Hou, Mrinmaya Sachan, Ryan Cotterell
  • 所属:ETH zurich

背景

LLMは、与えられた例示からタスクを学習し実行する能力、すなわち文脈内学習を示すと言われています。文脈内学習は、コード生成や教育、医療など幅広い分野で活用されています。しかし、文脈内学習がどのようなメカニズムで機能しているのかについては見解が分かれています。

文脈内学習の謎を解明するため、これまで研究者たちによってさまざまな仮説が提唱されてきました。仮説は大きく3つに分類されます。

1つ目の仮説は、「新しいことを学んでいるわけではなく、既に知っているタスクを識別しているだけ」というものです。つまり、LLMは訓練段階で多くのタスクを学習し、使用時には、与えられた例を見て、『これはどのタスクだろう?』と判断し、そのタスクを実行するのだという考え方です。

2つ目の仮説は、「LLMは訓練段階で「学び方」そのものを学習し、使用時には、「学び方」を使って新しいタスクを学習する」という考えです。LLMが本当の意味で新しいことを学べるという考え方です。

3つ目の仮説は、上記2つの中間的な考え方とも言えるもので「LLMは訓練段階で基本的なタスクを学習し、使用時には基本タスクを組み合わせて、新しく複雑なタスクを作り出す」という内容です。

今回、3つの仮説のどれが正しいのか、あるいは全て間違っているのかを確かめるべく、研究者らは一連の実験を行いました。

そして文脈内学習の本質や能力、限界についての新たな洞察が得られました。

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能
  • プロンプト管理ツールの利用

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に
  • プロンプト管理ツールの無制限使用

記事検索

年/月/日
年/月/日

関連記事