こんにちは。エンジニアライターの小原です。
連載「現場にコミットする機械学習ノート」では、論文を詳しく読み解きながら、現場で使えるAI実装のヒントを記録していきたいと思います。
前回の記事では、「決定木で地表の水を見つける」を扱いました。
今回は、スロベニアのJožef Stefan InstituteのM. MartincらがCLEF 2019で発表した「ツイート主をツイートからプロファイリングする」に関する論文を扱っていきます。
もくじ
1章 著者プロファイリングの可能性
2章 ロジスティクス回帰でツイートからツイート主をプロファイリングする
2.1 研究目的:性別、年齢、知名度、職業を当てる
2.2 研究手法:「n-gram特徴量」を使用
2.3 研究結果:複数モデルを検証するとロジスティック回帰の優位性が現れた
■前回の記事:【vol.20】決定木で地表の水を見つける
1章
著者プロファイリングの可能性
著者プロファイリング(AP)とは、その人が作成した文章に基づいて、その人の人口統計学的特徴や心理的特徴を学習することを扱う分野です。この分野で最も一般的な作業は、性別、年齢、言語などについての予測です。
作成した文章からその人の特徴を上手く推測することができる技術があれば、webマーケティングや保険業など多くのビジネス領域において活用できるのではないでしょうか。
そこでスロベニアのM. Martincらは、ツイートからツイート主のプロファイリングを行うことに挑戦しました。
2章
ロジスティック回帰でツイートからツイート主をプロファイリングする
まずはM. Martincらの研究におけるミッション・手法・結果をまとめます。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。