LLMに自分自身の内部動作を説明させる手法

研究者らは、LLMの内部表現を調べる新しいフレームワークを開発しました。LLMの内部表現とは、モデルがテキストを処理する際に内部的に生成する、ある種のデータやパターンのことを指します。 今回、LLM自身によって内部の動作 … 続きを読む LLMに自分自身の内部動作を説明させる手法