LLM性能向上！人間的カリキュラム学習の効果検証

2023.12.23

学習手法（ファインチューニング、RLHF、事前学習、instruction tuning）

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

ペンシルベニア大学やNAVERの研究者らが、人間の教材にインスパイアされたチューニング手法によってLLMを賢くする手法を検証しています。

難易度や認知負荷レベルを徐々に高めるような学習の仕方によって、従来のチューニング手法よりもLLMの性能が上がるとのことです。

– “Instruction Tuning with Human Curriculum”

■研究に至る背景
LLMの指示チューニング（指示＆応答ペアデータで学習する方法）において、「カリキュラムが整理されていないのでは？」と考えた

■手法のポイント
① 人間の教材を模倣したデータセットを作成する
（『CORGI』）
② 学習データは教育段階や認知レベルで分類する
③ 難易度に応じて段階的に学べるように整理する

■実験の方法
① CORGIでモデルを訓練した
② 学習の順序がモデルの性能に与える影響を調査した
（実験で使用されたモデルはLLaMA2-13B）

■実験の結果
① 段階的な学習カリキュラムによって性能が上がった
② 具体的にはMMLUで3.06%向上した
（MMLU：科学を中心とした広範囲なテスト）

研究者らは上記の結果から、LLMにも人間の教育ノウハウが役立つことを示唆しています。

今後はさまざまなモデルや学習データで試していくべきと述べています。

■論文情報

著者: 著者：Bruce W. Lee, Hyunsoo Cho, Kang Min Yoo

こちらもどうぞ