次回の更新記事:今週の注目AI論文リスト(論文公開日2026/2/1~2/7)(公開予定日:2026年02月08日)
「論文データベース(β版)」公開しました!新着論文を日本語で検索できます。ぜひご活用ください。 見てみる

脳波解読でinner speechをテキスト化

音声・音楽(音声認識、TTS、音楽生成、音声対話)

📝 これは「短信」です ― AIDBリサーチチームが独自の視点で論文を紹介する、カジュアルで読みやすいコンテンツです。

人が話そうとしている内容を文章に変換するシステムが作られたとのこと。声を出そうとしたときだけでなく、心の中で話していることも文章化できることが分かっています。
コロンビア大学やスタンフォード大学などの研究者らによる報告です。

この分野の他の技術と比べて、実用的なレベルに大きく 近づいたとされています。
ただし「心の中で話している」内容の再現は、まだ限定的な条件で実現するにとどまっています。

面白いことに、人間の約98時間分の脳活動データに加えてサルの約269時間分もモデルの学習に使用しています。
人間とサルの脳の基本的な動作原理には共通性があり、サルの脳活動データもしっかり役立つとのことです(人間データの方がより有用ではある)。

なお、技術的にはLLMを活用しており、高度な推論能力よりも音声や言語の基礎的な知識の方が大事だったそうです。

また、システムの実験を通して「声を出そうとしたとき」と「心の中で話している」ときで脳表現に共通性があることが明らかになったと述べられています。

こうした技術は、まずは医学分野で役立つことが期待されています。

📄 参照論文

Decoding inner speech with an end-to-end brain-to-text neural interface

著者: Yizi Zhang, Linyang He, Chaofei Fan, Tingkai Liu, Han Yu 他

所属: Columbia University, Stanford University, Microsoft

関連記事