読唇術はAIで出来る時代か。くちびるにご注意を(AI×IoT)【論文】

   

コンピュータで人の唇の動きを読み取る

人とコンピュータは、視覚や聴覚、触覚などを通じてインタラクション可能になってきた。現在では、さらなるインタラクティブな体験の実現のために、読唇認識という新技術に期待が集まっている。読唇とは、話者の唇の動きからその人が言っ​​ていることを認識することだ。

読唇技術を使えば、より効率的で便利なコミュニケーションの方法を確立できるかもしれない。特に、音声の重ね合わせのノイズの多い環境や、聴覚障害のある人々にとって有用な技術となるだろう。しかし従来の読唇認識システムは、認識に時間がかかり、パラメータ数が多いので実用化するのは難しい。

重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。



中国にある情報科学技術大学院のJing Wenら研究者は、従来の読唇システムの性能だとアプリケーション化するのは難しいという課題に着目し、Raspberry Piに基づくモバイルエンドで高速な読唇認識システムを提案した。

その結果、このシステムの性能はどうだったのだろうか?続きを読んでみよう。

Raspberry Piを用いた読唇システムの構築

J. Wenらの研究における「ミッション・手法・結果」は以下の通りだ。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP