本質的にインタラクティブなロボット【AI論文】

強化学習

強化学習（RL）により、ロボットはフィードバックに基づいて動的環境で最適な行動戦略を学習することができることが発表された。ロボットRL中の明示的な人間のフィードバックは、明示的な報酬関数を簡単に適応できるため、有利である。しかし、人間が継続的かつ明示的にフィードバックを生成することは非常に困難で面倒なことであるため、暗黙的なアプローチの開発は非常に重要であると言える。

Su Kyoung Kimら研究者は、RLの本質的に生成された暗黙的なフィードバック（報酬）として、エラー関連電位（ErrP）、人間の脳波（EEG）のイベント関連アクティビティを使用した。

提案されたアプローチの概念。ロボットは、人間との対話を通じて最適な行動戦略を見つけようとする。ロボットは可能な行動戦略を探り、人間からフィードバック（報酬）を受け取る。ロボットの目標は、長期的に総報酬を最大化することだ。このようにして、人間は自由にジェスチャーを選択し、ロボットにフィードバックを提供しながら、ロボットは行動戦略を学習して適応させることができる。最終的に、ロボットは人間のジェスチャーの意味を暗黙的に学習する。

ジェスチャー認識

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。

※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
 プレミアム会員（記事の購読）について

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

産業用高速ロボット制御のための機械学習【AI論文】

AI導入に悩んだらするべき6つの良い質問　−40%のAIスタートアップがAIを使っていない事態において

SNSでも発信中

企業と働き手を繋ぐマッチングサービスはこちらから

AIDBとは

AIDBは、論文などの文献に基づいてAIの科学技術や市場にキャッチアップするためのサービスです。個人の研究や仕事探し、法人の調査や採用を支援します。2019年から運営しています。