A menu of designs for reinforcement learning over time

作者： W Thomas Miller , Richard S Sutton , Paul J Werbos

DOI:

关键词: Error-driven learning 、 Reinforcement learning 、 Programming language 、 Code (cryptography) 、 Simple (abstract algebra) 、 Action (philosophy) 、 Computer science 、 Dynamic programming

摘要: This chapter contains sections titled: Introduction and Overview, A Simple Two-Component Adaptive Critic Design, HDP and Dynamic Programming, Alternative Ways to Figure 3.2 in …

ieee.org 本地加速

acm.org LINK 下载加速

参考文章(0)

A menu of designs for reinforcement learning over time

来源期刊

我的账户

A menu of designs for reinforcement learning over time

来源期刊

相似文章 10

我的账户