アルファ碁に採用されている「強化学習」で、ドローンを動かすと何が起こるのだろうか?しかし現実でドローンを訓練するのはリスクが高い。そこでシミュレーションの登場というわけだ。
「強化学習」環境は少ない?
近年、強化学習(RL)がロボット工学や自動運転技術をはじめとして、さまざまな分野で用いられています。強化学習とは、機械学習の手法の一つです。囲碁の世界チャンピオンを破ったAlphaGoに用いられています。「望ましい行動にポイントを付ける」という手法をとっています。詳しい説明はこちら。
しかし、OpenAIGym(強化学習のアルゴリズム開発のためのツールキット)をはじめとする強化学習のシミュレーション環境はまだまだ少ないです。強化学習は制御理論と深層学習のギャップを埋める解決策となるように思えますが、強化学習を使って現実的な制御シミュレーションを行う研究はまだ始まったばかりです。
そこでトロント大学のJacopo Paneratiらは、ロボット工学と機械学習の両方に関連のある、クワッドコプター(4枚翼のドローン)に着目しました。しかしながら、既存のクアッドコプターシミュレータには問題点があります。それは、複数のドローンをシミュレートできないという点です。
複数台のドローンをシミュレートする環境を構築するには、どのような手法を用いればいいのでしょうか。Jacopo Paneratiらの研究を紹介します。
結論として、研究者らは、物理エンジンを搭載したドローンのシミュレーション環境を新たに構築することで、現実的なシミュレータを提供しました。
複数台ドローンをシミュレートするには
まずはJacopo Paneratiらの研究におけるミッション・手法・結果をまとめました。
また記事の購読には、アカウント作成後の決済が必要です。
※ログイン/初回登録後、下記ボタンを押してください。
AIDBとは
プレミアム会員(記事の購読)について
■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。