UCバークレーの研究者らは、まるでアルファ碁とChatGPTを混ぜて強くしたようなAIエージェント「Dynalang」の仕組みを構築し、開発を進めています。すでに一部のタスクで優れたパフォーマンスを見せています。
○ Jessy Lin et al. Learning to Model the World with Language
Dynalangは、視覚的な経験とそれに関連する言語的な記述を同時に学び、その知識を使って未来を予測します。この仕組みは、人間の脳の働きを模倣したものです。
Dynalangは、特定のタスクを自律的に実行する能力を持つ”AIエージェント”として設計されています。
現在のところ、Dynalangはマニュアルを読んでゲームの最も困難なステージに適応し、優れたスコアを得ることができると主張されています。また、視覚的にも言語的にも複雑な指示にも従うことができるとのことです。
従来の大規模言語モデルと比較してより広範で深く自然な言語理解を持ち、さらにゲームや運転などの複雑な視覚タスクをこなすマルチなAIが実現すると見込まれています。