コンピュータで人の唇の動きを読み取る
人とコンピュータは、視覚や聴覚、触覚などを通じてインタラクション可能になってきた。現在では、さらなるインタラクティブな体験の実現のために、読唇認識という新技術に期待が集まっている。読唇とは、話者の唇の動きからその人が言っていることを認識することだ。
読唇技術を使えば、より効率的で便利なコミュニケーションの方法を確立できるかもしれない。特に、音声の重ね合わせのノイズの多い環境や、聴覚障害のある人々にとって有用な技術となるだろう。しかし従来の読唇認識システムは、認識に時間がかかり、パラメータ数が多いので実用化するのは難しい。
重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。
中国にある情報科学技術大学院のJing Wenら研究者は、従来の読唇システムの性能だとアプリケーション化するのは難しいという課題に着目し、Raspberry Piに基づくモバイルエンドで高速な読唇認識システムを提案した。
その結果、このシステムの性能はどうだったのだろうか?続きを読んでみよう。
Raspberry Piを用いた読唇システムの構築
J. Wenらの研究における「ミッション・手法・結果」は以下の通りだ。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。