DeepMindの新しいAI『MuZero』は、ルールをゼロから学んで極める。/研究者公認の解説記事【AI×エンタメ】（論文） | AIDB

ホーム
エンタメ・アート, 有料記事, 論文
DeepMindの新しいAI『MuZero』は、ルールをゼロから学んで極める。/研究者公認の解説記事【AI×エンタメ】（論文）

次回の更新記事：LLMに「意図」を含んだ回答をさせる方法の効果（公開予定日：2025年04月04日）

DeepMindの新しいAI『MuZero』は、ルールをゼロから学んで極める。/研究者公認の解説記事【AI×エンタメ】（論文）

この記事は、DeepMindの研究者でありこの記事で解説する論文の著者であるJulian Schrittwieserに事前に論文使用の許可をとりました。なんと内容のチェックまでしてもらえた上に「素晴らしいし、読みやすいね」とコメントをいただきました！ありがとうございます！

DeepMind発の強化学習アルゴリズム

2016年、AlphaGoが囲碁でプロ棋士を倒しました。その2年後に登場したAlphaZeroはルールのみから自己学習し、難解な3つのゲーム（囲碁、チェス、将棋）で人間を超えました。ただし、目覚ましい成功を収めたのは古典的なゲームだけではありません。これらの先読み探索に基づく計画アルゴリズムは、物流や化学などの実世界にも大きな影響を与えてきました。

しかし、実世界を構成する環境は複雑で未知であることばかりです。先読み探索ではゲームのルールや正確なシミュレータなどの環境のダイナミクスの知識に依存しているため、実世界の領域に直接適応できません。そこで環境に関する知識を必要とせず、複雑な領域においても活用できる手法が必要となっていました。

ダイナミクスに関する知識を必要としない強化学習アルゴリズムの開発という課題において、実際にどんな研究が行われているのでしょうか。Googleの子会社であるDeepMindのJulian Schrittwieser、Thomas Hubertら研究者の発表を紹介しましょう。

研究者らは、AlphaZeroのPolicy networkおよびValue networkを継承した新しいモデルベース強化学習の「MuZero」を構築し、囲碁・チェス・将棋に加えて難易度の高いAtariのゲームにおいて最先端の性能を実現しました。

エージェントの意思決定に重要なことだけを学習させる

まずはJulian、Thomasらの研究におけるミッション・手法・結果をまとめました。

当サイトの利用にはAIDBのアカウントが必要です。
また記事の購読には、アカウント作成後の決済が必要です。

※ログイン/初回登録後、下記ボタンを押してください。

AIDBとは
 プレミアム会員（記事の購読）について

■サポートのお願い
AIDBを便利だと思っていただけた方に、任意の金額でサポートしていただけますと幸いです。

MonaCat

投稿者の過去記事

修士2年 (M2)．機械学習と自然言語処理の研究をしています．

2020年の1年間に公開されたシャープ株式会社のAI関連特許が色々オモシロイのでまとめてみた。

「重みの初期値は０にしないこと。なぜ？」AIクイズ応用編【第15問】

マッチングサービスのお知らせ

AIDBとは

AIDBは、論文などの文献に基づいてAIの科学技術や市場にキャッチアップするためのサービスです。個人の研究や仕事探し、法人の調査や採用を支援します。2019年から運営しています。

プロフィールを登録すると
仕事のオファーが届きます

プロフィール登録

おすすめポスト

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

MRI画像は、精神科におけるバイオマーカーになりえるか？…

機械学習による自閉症の早期診断ツールとは【AI×メンタル…

「海外版の検出と防止ためのＡＩシステム」が特許出願！（米…

クボタ社「農作業車のためのコスパに優れた障害物検出AIシ…

「ＡＩで加熱物が沸騰しているか判断するシステム」が特許出…

prev

next

Copyright © AIDB All rights reserved.