機械翻訳の精度を上げるには?
近年、AIを用いた多言語の機械翻訳は着実に進化している。高品質な機械翻訳を実現するためには、翻訳したい異なる言語間での大規模な対話コーパス(テキストを集めたデータベース)が必要となる。しかし、英語のような公用語に比べて、世界的にメジャーでない言語の対訳コーパスを収集することは特に困難である。
重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。
南アフリカにあるNorth-West大学のCindy A. McKellarらは、南アフリカの11の言語(Afrikaans, English, isiNdebele, isiXhosa, isiZulu, Sepedi, Sesotho, Setswana, Siswati, Tshivenḓa and Xitsonga)に使用できる機械翻訳システム評価データセットを構築した。
結果はどうだったのだろうか。英語以外のマイナー言語が正確に機械翻訳される未来は来るのか?
南アフリカの11つの言語で使える評価用データセットを作成
Cindy A. McKellarらの研究におけるミッション・手法・結果は以下の通りだ。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。