本質的にインタラクティブなロボット【AI論文】

   

強化学習

強化学習(RL)により、ロボットはフィードバックに基づいて動的環境で最適な行動戦略を学習することができることが発表された。 ロボットRL中の明示的な人間のフィードバックは、明示的な報酬関数を簡単に適応できるため、有利である。 しかし、人間が継続的かつ明示的にフィードバックを生成することは非常に困難で面倒なことであるため、暗黙的なアプローチの開発は非常に重要であると言える。

Su Kyoung Kimら研究者は、RLの本質的に生成された暗黙的なフィードバック(報酬)として、エラー関連電位(ErrP)、人間の脳波(EEG)のイベント関連アクティビティを使用した。

提案されたアプローチの概念。ロボットは、人間との対話を通じて最適な行動戦略を見つけようとする。ロボットは可能な行動戦略を探り、人間からフィードバック(報酬)を受け取る。ロボットの目標は、長期的に総報酬を最大化することだ。このようにして、人間は自由にジェスチャーを選択し、ロボットにフィードバックを提供しながら、ロボットは行動戦略を学習して適応させることができる。最終的に、ロボットは人間のジェスチャーの意味を暗黙的に学習する。
重要なお知らせ:AI分野のお仕事マッチングサービス「AIDB HR」を開始しました!登録後はオファーを受け取るだけのシンプルなサービスです!現在、期間限定で、ギフト券が必ずもらえる新規登録キャンペーンも行っています。



ジェスチャー認識

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。



※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
プレミアム会員(記事の購読)について


■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。






PAGE TOP