課題:インターネット上に増加する不適切な文章
インターネットの発展と利用者の増加により、近年ではSNSやブログなどを通じて大量の電子コンテンツで溢れかえっています。このようなオンラインコンテンツは有用ですが、同時に不適切なコンテンツも増加しています。悪質な行動を広めたり、違法な行為の助長、他人を罵倒するといった不適切な投稿が当たり前のように公開されているのです。
このような不適切なコンテンツは文章・音声・動画など様々な形式で公開されていますが、文章を利用するケースがほとんどです。そこで自然言語処理(NLP)の困難な課題の1つとして知られている、特定のコンテンツから不適切な文章を効率的に識別するというタスクが益々重要となっています。
重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。
不適切な文章の効率的に分類するという課題において、実際にどんな研究が行われているのでしょうか。バングラデシュにあるチッタゴン工科大学のOmar Sharifら研究者の発表を紹介しましょう。
研究者らは、ベンガル語の文章を原文の内容に基づいて「不適切」と「適切」の二値分類を行う機械学習ベースの分類モデルを構築しました。
テーマ:機械学習による不適切な文章の分類
まずはOmar Sharifらの研究におけるミッション・手法・結果をまとめました。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。