次回の更新記事:AIコーディングエージェントのコスト構造を読み解く(公開予定日:2026年05月26日)
AIDB Daily Papers

音声認識モデルのメカニズムを疎なオートエンコーダで解明する

原題: Mechanistic Interpretability of ASR models using Sparse Autoencoders
著者: Dan Pluth, Zachary Nicholas Houghton, Yu Zhou, Vijay K. Gurbani
公開日: 2026-05-12 | 分野: LLM NLP Transformer 機械学習 AI 自然言語処理 XAI cs.CL 音声認識

※ 日本語タイトル・ポイントはAIによる自動生成です。正確な内容は原論文をご確認ください。

ポイント

  • Transformerベースの音声認識モデルの内部メカニズムを理解するため、疎なオートエンコーダを適用した。
  • LLMでの応用は示されていたが、音声処理モデルへの適用は本研究が初であり、言語横断的な特徴抽出を示唆する。
  • Whisperモデルから抽出した特徴量に疎な潜在空間を学習させ、言語的・非言語的な多様な特徴とクロスリンガルな特徴操作を発見した。

Abstract

Understanding the internal machinations of deep Transformer-based NLP models is more crucial than ever as these models see widespread use in various domains that affect the public at large, such as industry, academia, finance, health. While these models have advanced rapidly, their internal mechanisms remain largely a mystery. Techniques such as Sparse Autoencoders (SAE) have emerged to understand these mechanisms by projecting dense representations into a sparse vector. While existing research has demonstrated the viability of the SAE in interpreting text-based Large Language Models (LLMs), there are no equivalent studies that demonstrate the application of a SAE to audio processing models like Automatic Speech Recognizers (ASRs). In this work, a SAE is applied to Whisper, a Transformer-based ASR, training a high-dimensional sparse latent space on frame-level embeddings extracted from the Whisper encoder. Our work uncovers diverse monosemantic features across linguistic and non-linguistic boundaries, and demonstrates cross-lingual feature steering. This work establishes the viability of a SAE model and demonstrates that Whisper encodes a rich amount of linguistic information.

Paper AI Chat

この論文のPDF全文を対象にAIに質問できます。

質問の例:

AIチャット機能を利用するには、ログインまたは会員登録(無料)が必要です。

会員登録 / ログイン

💬 ディスカッション

ディスカッションに参加するにはログインが必要です。

ログイン / アカウント作成 →

関連するAIDB記事