人間の「視線データ」(目がどこを見ているか、どう動いているか)をLLMが処理できる形式で入力する効率的な方法が明らかにされました。
視線データには、位置と速度が存在し、これが予測できるようになると例えばユーザーインタフェースの改善や、ユーザーエクスペリエンスの最適化につながる可能性があります。
また、視線パターンからメンタルヘルス状態を予測するアプリケーションへの応用なども検討されています。
LLMの事前学習や微調整時に組み込める可能性があるほか、プロンプトに入力することで既存のモデルでも比較的安定した出力が得られると期待されています。