A joint imitation-reinforcement learning framework for reduced baseline regret

作者： Sheelabhadra Dey , Sumedh Pendurkar , Guni Sharon , Josiah P Hanna

DOI:

关键词:

摘要: In various control task domains, existing controllers provide a baseline level of performance that—though possibly suboptimal—should be maintained. Reinforcement learning (RL) …

ieee.org 本地加速

arxiv.org PDF 下载加速

参考文章(0)

A joint imitation-reinforcement learning framework for reduced baseline regret

来源期刊

我的账户

A joint imitation-reinforcement learning framework for reduced baseline regret

来源期刊

相似文章 0

我的账户