読唇術はAIで出来る時代か。くちびるにご注意を(AI×IoT)【論文】

   
重要なお知らせ
AIスキル人材と企業をつなぐマッチングサービス「AIDB HR」を開始しました!
仕事を探す方はこちら、人材を探す企業の方はこちらからご利用ください。

コンピュータで人の唇の動きを読み取る

人とコンピュータは、視覚や聴覚、触覚などを通じてインタラクション可能になってきた。現在では、さらなるインタラクティブな体験の実現のために、読唇認識という新技術に期待が集まっている。読唇とは、話者の唇の動きからその人が言っ​​ていることを認識することだ。

読唇技術を使えば、より効率的で便利なコミュニケーションの方法を確立できるかもしれない。特に、音声の重ね合わせのノイズの多い環境や、聴覚障害のある人々にとって有用な技術となるだろう。しかし従来の読唇認識システムは、認識に時間がかかり、パラメータ数が多いので実用化するのは難しい。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

中国にある情報科学技術大学院のJing Wenら研究者は、従来の読唇システムの性能だとアプリケーション化するのは難しいという課題に着目し、Raspberry Piに基づくモバイルエンドで高速な読唇認識システムを提案した。

その結果、このシステムの性能はどうだったのだろうか?続きを読んでみよう。

Raspberry Piを用いた読唇システムの構築

J. Wenらの研究における「ミッション・手法・結果」は以下の通りだ。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP