「RNNと衛星データで農地を分類!」現場にコミットする機械学習ノート【vol.3】

   

最終更新日:2020/07/19

こんにちは。エンジニアライターの小原です。

連載「現場にコミットする機械学習ノート」では、論文を詳しく読み解きながら、現場で使えるAI実装のヒントを記録していきたいと思います。

重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。



前回の記事では、「うつ病の分類」を扱いました。

今回からは数回にわたって、農業のDXに使えそうな「衛星データ×土地分類」の研究を紹介します。データの種類、手法を記事ごとに比較してみると面白いかもしれません。

国内ではNTT空間情報がJAXAの衛星データ利用機関として登録するなど、事業に衛星データを活用する動きが活発です。また海外では米国のFamlogsが衛星画像から収集した土壌や農作物の状態をもとに適切な作付量や肥料の分量などを農家にアドバイスしています。このサービスはアメリカの農家の3分の1が活用するほど人気だといいます。

今回は、フランスのモンペリエ大学のE. Ndikumanaらが2018年8月に発表したRNNによる農地作物の分類」に関する論文を扱っていきます。

もくじ
1章 農地作物の分類における課題
2章 衛星データを利用した農地の分類
2.1 研究目的
2.2 研究手法
2.2.1 地上データ
2.2.2 衛星データ
2.2.3 手法の概要
2.2.4 実験の概要
2.3 研究結果
2.3.1 手法ごとのF値、精度、Kappa値
2.3.2 F値の比較と混同行列による可視化
2.3.3 RNNベースのGRU分類器を適用して作成した農地被覆図

■前回の記事:【vol.2】うつ病の分類

1章
農地作物の分類における課題

最近運用が可能となった、欧州宇宙機関のSentinel-1(センチネル-1)は、約20mの高い空間分解能で6日間の再訪期間を備えた衛星データ(SAR)をグローバルにカバーする衛星システムです。このシステムから得られるレーダーデータは、農作物に関する空間情報を提供するため、貴重だと言えるでしょう。

一方で、農地の作物を地図化するための手法の開発・改良においては、レーダーデータの取り扱いが大きな課題となっています。この原因としては、レーダー特有のノイズの性質があり、これがレーダーの使用頻度の低さにつながっています。

そこでフランスのE. Ndikumanaらは、リカレントニューラルネットワークRNN)と従来の手法を利用して、衛星データ(SAR)から農地を分類することを試みました。

2章
衛星データを利用した農地の分類

まずはE. Ndikumanaらの研究におけるミッション・手法・結果をまとめます。

✔️課題
レーダーデータを農地分類に活用する。

✔️解決手法
衛星データ(SAR)を用いてRNNと従来の手法の両方で農地を分類した。

✔️結果
どの手法による分類でも良好な性能が示された。

研究の詳細を以下で述べます。

2.1 研究目的

衛星データには複数の種類があります。たとえば、 光学センサ、SARセンサ、赤外線センサなどによる測定結果です。SARとはSynthetic Aperture Radarの略であり、地面に反射させたマイクロ波を測定するので天候に左右されないのが利点です。

しかし、SARセンサはレーダー使用に伴うノイズの性質によって、光学センサによるデータよりも扱いづらいという課題があります。

E. Ndikumanaらは、機械学習を用いてこの課題をクリアしようと試みました。

2.2 研究手法

E. Ndikumanaらは、衛星データ(SAR)を用いて作物分布を分類するタスクにおける性能を、RNNベースの分類アプローチ(LSTMとGRU)と標準的な機械学習アプローチとで比較しました。

2.2.1 地上データ

・フランス南東部に位置するカマルグ地方のデータを使用しました。
・調査地域では、 54,082 ha(図 のシアン色の多角形を参照)に相当し、その中の湿原、果樹園、オリーブの木の地域は 17,859 ha であり、残りの 36,223 ha が一般的な農業活動に使用されています。

カマルグの調査地域。色付きの多角形は、921の参照プロットの場所を表します。調査範囲はシアン色の多角形によって制限されます。

・土地被覆情報を収集するために、2017年7月に921の参照区画について現地調査が行われました。
・それぞれの区画は11クラス((1)米、(2)ヒマワリ、(3)芝生、(4)灌漑草地、(5)デュラム小麦(冬期)、(6)アルファルファ、(7)トマト、(8)メロン、(9)クローバー、(10)沼地、(11)ぶどう園)に分類されています。

2.2.2 衛星データ

・形式はSARデータでした(画像ではないことに注意)。
・Sentinel-1A / 1B SARデータセットを使用しました。
・2017年5月から9月まで(5か月)の地形観測(再訪問期間は6日間)で収集された25回分のデータです。
・これは二重偏波(VV + VH)データであり、50枚の画像になります。

2.2.3 手法の概要

RNNモデルを提案しました。
RNNにはLong-Short Term Memory(LSTM)とGated Recurrent Unit(GRU)の2つのユニットが知られており、両方を試しました。
・入力データはSARデータ(VVとVHの二つ)です。
・出力層はSoftMaxです。
・隠れ層の次元数:512
・初期学習率は5×10-4、rhoは0.9、減衰率は5×10-5
・学習にはRmspropを採用
損失関数は多クラス交差エントロピー
バッチサイズ:64
エポック数:250
・5分割交差検証を用いて学習されました。

RNNLSTMベースのアーキテクチャの概略図です。LSTMをGRUユニットに置き換えることで、RNNのGRUベースのアーキテクチャが得られます。





2.2.4 実験の概要

k近傍法ランダムフォレスト(RF)、サポートベクターマシン(SVM)、LSTM、GRUとで性能を比較しました。

K近傍法
・最近傍数:10
Scikit-learnで実装

ランダムフォレスト
・ツリー数:400
・最大深さ:25
Scikit-learnで実装

SVM
・LibSVMで実装

2.3 研究結果

結果、古典的なアプローチと先進的な深層RNN技術の両方において、良好な結果を得ました。検証の指標としては、F-measure/Accuracyが86%以上、Kappa係数が0.82以上と良好な結果が得られました。これらの結果から、Sentinel-1の時系列データが農地被覆アプリケーションに適していることが確認されました。

2.3.1 手法ごとのF値、精度、Kappa値

すべての分類器の性能指標が高いことがわかりました。

時系列SAR Sentinel-1データ上での5分割交差検証法からの平均値と標準偏差。

2.3.2 F値の比較と混同行列による可視化

・結果は、古典的な機械学習手法(KNN、RFおよびSVM)よりもRNNベースの分類アプローチを使用した方がより良い性能を示しました。
・2つのRNNモデルの間で、GRUベースの手法は、LSTMよりもわずかに良い結果を得ました。

手法、クラスごとのF値

手法ごとのSAR Sentinel-1時系列データの混同行列。(a) KNN(b) RF (c) SVM (d) LSTM(e) GRU.
ラベルの名前。(1)米、(2)ヒマワリ、(3)芝生、(4)灌漑草地、(5)デュラム小麦(冬)、(6)アルファルファ、(7)トマト、(8)メロン、(9)クローバー、(10)沼地、(11)ブドウ畑。

2.3.3 RNNベースのGRU分類器を適用して作成した農地被覆図

Sentinel-1のデータとRNNベースのGRUで作成したカマルグの農地被覆図。

RNNベースのGRU分類器を適用して、2017年のカマルグの農地被覆図を作成しました。上図のように提案手法は、衛星データから作物分布をうまく分類できていることがわかります。フランスのカマルグにおける農業クラスの分類にSentinel-1データを用いることができると言えました。

研究紹介は以上です。

衛星データを用いることで、農業に関する調査を行ったり、農地の管理をすることが簡単になるかもしれません。

今回は「RNNによる農地作物の分類」について解説しました。次回は「CNNによる土地の分類」を取り上げていきます。お楽しみに!

【現場にコミットする機械学習ノート・バックナンバー】


この記事で取り扱った論文:Ndikumana, E.; Ho Tong Minh, D.; Baghdadi, N.; Courault, D.; Hossard, L.,”Deep Recurrent Neural Network for Agricultural Classification using multitemporal SAR Sentinel-1 for Camargue, France”,Remote Sens.201810, 1217. DOI





■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP