動画中から”難関”アラビア語の抽出なるか(AI×エンタメ)【論文】

   

動画中の文字の認識はむずかしい

テレビ番組に字幕やテロップがあるおかげで、番組をじっくり観ていなくても、話の筋を簡単に目で追うことができる。テレビに限らずYouTubeなどでも、動画中に埋め込まれたテキストは、その動画コンテンツの重要ポイントを視聴者に伝えている場合が多い。

動画のようなファイルサイズの大きいデータを保存できる大容量記憶技術の急速な進歩のおかげで、世界中で膨大な数のニュース動画が保存されるようになった。想像してみてほしい。これらの膨大な動画のすべてに対し、人間が手動でテキストを埋め込む(アノテーションする)ことはできるだろうか?きっとお手上げ状態になることだろう。

こうした人手不足な状況で活躍が期待されているのが、動画中の文字を自動認識する技術(OCR:光学式文字認識)である。OCRは通常、画像中の文字を認識するものだが、その応用として、これまでいくつかの研究で動画中の文字認識が試されてきた。しかし、研究事例の多くはラテン語や中国語に特化しており、アラビア語には対応していなかった。

重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。



チュニジアにあるスース大学のO. Zayeneら研究者は、動画における文字認識に取り組む上で、複数タスクに対応できるアラビア語のデータセットがなかったという課題に着目し、AcTiVデータセットの新しいバージョンを紹介し、複数のテキスト検出および認識アルゴリズムを比較した。結果、性能の良い手法が明らかになった。

アラビア語のニュース動画の文字認識に挑戦

O. Zayeneらの研究のポイントは以下の通りだ。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP