次回の更新記事:ハルシネーションは「AIのせい」だけではなく「クエ…(公開予定日:2026年03月05日)
AIDBは、AI活用のノウハウ獲得や技術動向の調査のために、個人やチームが論文を探す・読む・活かす作業をサポートするプラットフォームです。なお、記事や投稿は人の手で書いています。

プロンプトの小さな違いがLLMにもたらすバタフライ効果を調査した結果

2024.01.17
深堀り解説

出力形式や小さなプロンプトの変更がどれほどLLMの応答に影響するのかを、大量のケーススタディで実験した結果が報告されています。

結論としては、少しのプロンプトの違いが様々なタスクで大きな違いをもたらすことが分かりました。そして、従来信じられてきたことと実際のズレに関しても述べられています。

例えば ”チップをあげる” といった言葉も、タスクによって効果が異なる(ときには逆効果を及ぼす)ことが示唆されています。

参照論文情報

研究背景

LLMは様々なタスクに対して有用さが検証されていますが、その中でもデータのラベリングに一定の注目が集まっています。データのラベリング(データ注釈)とは、 前処理のひとつで、非構造化データを機械が可読できるように編集するプロセスです。開発や分析において必要な作業です。

データのラベリングにおいてLLMに実行させる手順はシンプルで、以下のとおりです。

  1. プロンプトを作成する
  2. 機械が可読であるフォーマットにする
  3. 出力されない情報に関してはフィルタリングを考慮する

なお、手順3に関しては、ジェイルブレイク(脱獄)のプロンプトを実行するユーザーもいますが、開発元は推奨していません。ジェイルブレイクとは、システムに本来予期しない出力を行わせるためのユーザー側の工夫で、ハックの一種です。

全体の手順を通してプロンプトの設計が非常に重要な意味を持ちますが、プロンプトをどう変化させるとLLMの振る舞いがどう変わるのかについて、まだあまり明確にはわかっていません。なおデータのラベリングだけでなく、さまざまなケースにおいてプロンプトの設計がもたらす効果については多く報告されています。

そこで今回研究者らは、以下3つの観点から、プロンプトの影響を測定することを試みています。

  1. 出力形式を変化させる

    • Pythonリスト
    • JSON など

  2. 文面に小さな変更を加える

    • スペースを加える
    • ありがとうと伝える
    • チップを約束する など

  3. ジェイルブレイクを行う

評価にはいくつかのベンチマークを用意しています。詳細は後述します。

以下では、実験の方法論(タスク、出力形式、具体的に使用された脱獄方法名、チップの与え方など)と実験結果を紹介しています。

実験の方法論

今回研究者らは、

プレミアム会員限定コンテンツです

無料会員でもできること

  • 一部記事の閲覧
  • 研究紹介短信ライブラリの基本機能

プレミアム会員の特典

  • 全過去記事の無制限閲覧
  • 専門家による最新リサーチ結果を記事で購読(平日毎日更新)
  • 日本語検索対応の新着AI論文データベース
  • 研究紹介短信ライブラリの高度な機能を開放
  • 記事内容質問AIを使用可能に

💬 プレミアム会員ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

記事検索

年/月/日
年/月/日

関連記事