あらゆる文字起こしは発展途上
歴史的遺物の古代文書(古記録・古文書)をデジタル化するために、文書画像分析(DIA)システムの必要性が高まっている。DIAシステムによって、古代文書の内容を現代人が知ることができるほか、保存や普及にも役立ち、古代文書の存在を後世に残すことにもつながる。さらに、古代文書のような状態の悪い文書を読み込むことができれば、技術的な発展を示すことにもなる。
DIAの研究は急速に発展しており、英語やラテン語のみならず、アラビア語や中国語、日本語などの”非ラテン文字”についても取り扱えるようになってきた。過去20年間の研究で、こうした文字で記された古代文書の分析に関する多くの複雑な問題が解決されてきた。しかし、DIAはまだ発展が必要な研究分野である。たとえば、東南アジアのヤシの葉に書かれた文書についての分析は進んでいない。
フランスにあるラ・ロシェル大学のMade Windu Antara Kesimanら研究者は、東南アジアの歴史的文書を文字起こしする際にデータの劣化や文章の複雑性から文字起こしがうまく行かないという課題に着目し、複数の手法で二値化、テキスト線セグメンテーション、孤立文字/グリフ認識、単語認識および音訳に取り組んだ。結果、DIAコミュニティの研究者に、ヤシの葉に書かれた文書の分析の最新の調査結果と定量的ベンチマークを提供することができた。
【法人向け】課題に応じた先行研究を知りたい企業さま向けに、「先行研究調査サービス」を提供しています!サービスの概要はこちらから!
ヤシの葉に書かれた文書を分析
Made Windu Antara Kesimanらの研究のポイントは以下の通りだ。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。