人が話そうとしている内容を文章に変換するシステムが作られたとのこと。声を出そうとしたときだけでなく、心の中で話していることも文章化できることが分かっています。
コロンビア大学やスタンフォード大学などの研究者らによる報告です。
この分野の他の技術と比べて、実用的なレベルに大きく 近づいたとされています。
ただし「心の中で話している」内容の再現は、まだ限定的な条件で実現するにとどまっています。
面白いことに、人間の約98時間分の脳活動データに加えてサルの約269時間分もモデルの学習に使用しています。
人間とサルの脳の基本的な動作原理には共通性があり、サルの脳活動データもしっかり役立つとのことです(人間データの方がより有用ではある)。
なお、技術的にはLLMを活用しており、高度な推論能力よりも音声や言語の基礎的な知識の方が大事だったそうです。
また、システムの実験を通して「声を出そうとしたとき」と「心の中で話している」ときで脳表現に共通性があることが明らかになったと述べられています。
こうした技術は、まずは医学分野で役立つことが期待されています。
📄 参照論文
Decoding inner speech with an end-to-end brain-to-text neural interface
所属: Columbia University, Stanford University, Microsoft