Open 2020.01.29
ステアラボ人工知能セミナー #25

強化学習と逆強化学習を組み合わせた模倣学習

  • このエントリ
ーをはてなブックマークに追加

続きはログイン後!

1121
2467
タグ :

■ 動画紹介

本動画は、強化学習と逆強化学習を組み合わせた模倣学習と題して内部 英治 様(国際電気通信基礎技術研究所 脳情報通信総合研究所 主幹研究員)が登壇します。

https://researchmap.jp/uchibe/

講演概要

強化学習を適用する際に問題になるのは目的を規定する報酬関数の設計である。

逆強化学習は熟練者から提示されたデモンストレーションから報酬を推定する枠組みであり、

強化学習と逆強化学習を組み合わせた模倣学習はデモンストレーションに含まれない未知の状態に対しても適切な行動を学習できるといった、

単純な制御方策の模倣の問題点を克服できること、敵対的生成ネットワーク(GAN)の枠組みで解釈できることといった点から、近年多くの研究がなされている。

本公演では強化学習と逆強化学習の組み合わせによる模倣学習について紹介しつつ、

強化学習と逆強化学習が互いに関数近似器を共有することで学習効率を改善した我々のアルゴリズムを紹介する。


■ コンテンツ一覧

視聴条件:ログイン前では本動画は3分のみ視聴可能です。
※ログインいただくとすべて視聴できます。


  • このエントリ
ーをはてなブックマークに追加

関連動画