AIが会話中において”見た目の振る舞い”も実際の人間と見分けがつかないほど自然にこなせるような開発に成功したとのこと。
Metaの研究者らによる報告です。
研究者らは人間が無意識にやっている会話中の動作をAIに学習させました。
「相手が話しているときはうなずく」「自分が話すときは手振りをする」「相手が笑ったら一緒に笑う」といった動きです。
なお、ただ自然に振舞わせるだけでなく、感情の表現や手振りを「コントロールする」ことも可能だそうです。
学習データの用意は地道で、4,000人以上の人に対面で会話してもらい、その様子を”4,000時間以上”も録画しました。
さらに、ただ普通に話してもらうだけでなく、心理学の理論に基づいて様々な感情や態度で会話してもらったり、俳優さんに演技してもらったりもしたそうです。
ただし、現状は「ほぼ見分けがつかない」とは言いつつも「完全に見分けがつかないわけではない」ことに注意。
こうした技術はゲームのキャラクターやバーチャル会議、AIアシスタントの可視化などで活用されうると期待されています。
📄 参照論文
Seamless Interaction: Dyadic Audiovisual Motion Modeling and Large-Scale Dataset
所属: Meta, University of Kansas