(IJCAI2018)Behavior Clone from Observation

​ 通过这篇论文继续补充自己的理论知识。

​ 在智能体通过模仿others的任务完成过程从而进行模仿学习的时候,通常会遇到两个问题:

  • 通常模仿的内容(示教)只有状态信息而没有显式的动作信息。
  • 学习速度要非常快。

​ 这篇工作提出了一个2阶段的自动模仿学习技术,叫做behavior cloning from observation。

Read more