(IJCAI2018)Behavior Clone from Observation
通过这篇论文继续补充自己的理论知识。
在智能体通过模仿others的任务完成过程从而进行模仿学习的时候,通常会遇到两个问题:
- 通常模仿的内容(示教)只有状态信息而没有显式的动作信息。
- 学习速度要非常快。
这篇工作提出了一个2阶段的自动模仿学习技术,叫做behavior cloning from observation。
通过这篇论文继续补充自己的理论知识。
在智能体通过模仿others的任务完成过程从而进行模仿学习的时候,通常会遇到两个问题:
这篇工作提出了一个2阶段的自动模仿学习技术,叫做behavior cloning from observation。