年齢推定の精度アップが止まらない!注目の新手法(AI×マーケティング)【論文】

   
重要なお知らせ
AIスキル人材と企業をつなぐマッチングサービス「AIDB HR」を開始しました!
仕事を探す方はこちら、人材を探す企業の方はこちらからご利用ください。

最終更新日:2020/05/29

年齢推定の精度はどこまで向上するか

近年、機械学習を用いた顔情報の自動抽出に関する研究が盛んに行われている。顔画像からの機械学習に基づく年齢推定は、個人認証、フォレンジック研究、セキュリティ制御、人間とコンピュータのインタラクション、ソーシャルメディアなどに広く利用されており、その重要性はますます高まっている。

最近では、AlexNet、VggNet、InceptionなどのCNNを用いた研究が多くなされている。CNNなどディープラーニング技術の研究によって、年齢推定の精度は、ますます向上している。


AIDBの全記事が読み放題のプレミアム会員登録はこちらから↓

韓国にある慶北大学のYoosoo Jeongら研究者は、正面顔画像からの年齢推定の精度の向上という課題に着目し、シャムネットワークをベースとしたディープメトリック学習法を用いて畳み込みニューラルネットワーク(CNN)モデルを学習させた。

結果、精度は向上しただろうか?続きを読んでみよう。

AIで未来を変える仲間:Yoosoo Jeongについて
韓国の慶北大学・電子工学科のに所属。博士号取得済み。専門分野は、画像信号処理やパターン認識。

最先端を超える年齢推定の手法

Yoosoo Jeongらの研究におけるミッション・手法・結果は以下の通りだ。

✔️ミッション
顔画像から、より正確な年齢推定をする。

✔️解決手法
シャムネットワークベースのディープメトリック学習法を用いて畳み込みニューラルネットワーク(CNN)モデルを学習させた。

✔️結果
MORPHデータセットにおいてMAE平均絶対誤差)2.24を達成した。

研究の詳細を以下で述べる。

手法の進化によって年齢推定の精度は向上している

近年、機械学習を用いた顔情報の自動抽出に関する研究が盛んに行われている。特に、正面顔画像からの年齢推定が重要になってきており、様々な応用が期待されている。

Deep expectation(DEX)は、CNNモデルをベースにした年齢推定アプローチである。年齢推定のためにVggNetを用いて多クラス分類問題を解決し、ソフトマックス層での学習結果を対応するクラスでの確率と見なす期待値計算によって、適切な年齢を推定する手法を採用している。このアプローチでは、年齢推定問題をマルチクラス分類の観点から考えるのではなく、年齢分類問題を連続変数の推定による回帰ベースの問題として考えることで、マルチタスクCNNを適用している。

別のアプローチとして、深い層を持つCNNモデルを用いる代わりに、浅い層を持つ2値分類器を年齢の全クラスに適用している。最終的な年齢推定は、各2値 分類器によるすべての結果のランキングベースの包括的な組み合わせによって決定される。このランキングCNNは、二値分類器の結果のカスケードベースの組み合わせを用いた既存の機械学習手法の一つである。

上記のアプローチは、入力された顔画像から直接絶対年齢を推定することを目的としているが、参照データがない場合に絶対年齢を正確に推定することは容易ではない。そこでAbousalehらは、比較領域畳み込みニューラルネットワーク(CRCNN)と呼ばれる新しいアプローチを導入した。入力された顔画像を参照画像と比較して、年齢推定のために年齢が高いか低いかを判断する。

このように、年齢推定の精度の向上を目的として、さまざまな手法が研究されている。

距離学習によって顔画像を比較して利用する

Yoosoo Jeongらは、シャムネットワークベースのディープメトリック学習法を用いて畳み込みニューラルネットワーク(CNN)モデルを学習させた。

Yoosoo Jeongらが提案するアーキテクチャにおけるニューラルネットワークの構造、すなわちシャムネットワークの構造を図1に示す。

図 1. シャムネットワークの構造。





この2つのネットワークの構造と重みは完全に等価である。入力画像A、Bに対する2つのCNNモデルの出力を損失関数に適応し、損失関数の設計に応じて関係を決定する。この2つのネットワークを用いて、2つの入力画像A、Bの結果として推論に損失関数を適用する。

Yoosoo Jeongら は、2つのシャムネットワークベースのCNNモデルを用いて2つの入力画像から年齢比較を行う代わりに、1つのネットワーク内の学習モデルのバッチから2つの画像を選択して、対応する画像の推論結果を用いて対照的損失関数を適用した。

図2にアルゴリズム全体の説明図を示す。

図 2. 提案アルゴリズムの説明図。

CNNモデルの構築にはInception V3を使用しているが、ソフトマックス層は使用せず、全結合層を使用している。年齢と性別を同時に推定するためにマルチタスク学習を適用するために、さらに1つの全結合層を構築する。第1の全結合層は年齢比較を行い、第2の全結合層は性別比較タスクを行うことで年齢比較を支援する。

図2(a)に示すように、選択可能なすべての組み合わせを考慮して、バッチから2つの入力画像が選択される。選択されたAおよびB画像は、図2(d)の全結合層の最終出力である特徴ベクトルにマッピングされる。

提案する損失関数では、図2(b)に示すように、バッチ内の2つの画像が同じクラスの場合には特徴ベクトル間の距離が減少し、2つの画像が異なるクラスの場合には特徴ベクトル間の距離が増加するように、勾配値がネットワークに伝搬される。提案されたアーキテクチャは、2つの入力画像間の類似度を決定するために、提案されたアルゴリズムを用いて学習される。

テストステップでは、図2(c)に示すように、テスト画像の特徴ベクトルを訓練データベース全体の特徴ベクトルと比較し、最も類似した年齢クラスを選択することによって年齢推定を実行する。

従来法よりも高精度での年齢推定に成功

結果、MORPHデータセットにおいてMAE平均絶対誤差)2.24を達成した。これは、State-Of-The-Art(最先端)とするZhangらの手法よりも精度が高く、最も良い認識精度を達成したと言える。

表1. MORPHデータセットにおける最先端の手法とのMAEの比較
(* 顔アライメント法を適用、**ラベルを追加)。

研究紹介は以上だ。

年齢推定のさらなる向上によって、未来では多くのサービスが今とは全く違ったものになっているかもしれない。

AI×マーケティング」のほかの記事もどうぞ

▶ 店舗から消える前に品を供給することはAIにできるか
▶ オンライン広告の最適な最低落札価格の決め方
▶ アディダスと共同開発!膨大なアパレル製品を機械が分類


この記事で取り扱った論文:Yoosoo Jeong, Seungmin Lee, Daejin Park and Kil Houm Park, Accurate Age Estimation Using Multi-Task Siamese Network-Based Deep Metric Learning for Frontal Face Images, Symmetry201810(9), 385; - DOI



■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






業界/カテゴリー

PAGE TOP