既存のキャラクターの性格をLLMに模倣させることに特化したフレームワーク「チャットハルヒ」が登場しました。香港企業SenseTimeなどの研究者による開発です。
○ Cheng Li et al. ChatHaruhi: Reviving Anime Character in Reality via Large Language Model
方法論は以下のとおりです。
■アニメの台本などからデータ抽出してメモリDBを作成
(データの内訳は、キャラに特有の話し方など)
■言語モデルは会話の際にメモリDBを参照
■テンションや知識などの観点から模倣して演技
■ユーザーとシステムが、LLMがキャラにどれほど似ていたのかをフィードバック
なお研究者らは32種類のキャラクターメモリDBを「ChatHaruhi-54kデータセット」として提供しています。
さらに、gradioで作成されたデモも公開しています。
公開されているデータやデモは英語と中国語に対応しており(日本語に対応していませんが)、「キャラを模倣する」アプローチの型を例示している研究と言えます。