1、封面介绍

book.jpg

2、出版时间

2018年7月

3、推荐理由

本书共有19章,分为六大部分,详细介绍了强化学习中各领域的基本理论和新进展,内容包括:MDP、动态规划、蒙特卡罗方法、批处理强化学习、TD学习、Q学习、策略迭代的小二乘法、迁移学习、贝叶斯强化学习、一阶逻辑MDP、层次式强化学习、演化计算、预测性定义状态表示、去中心化的部分可观察MDP、博弈论和多学习器强化学习等内容,并阐述强化学习与心理和神经科学、游戏领域、机器人领域的关系和应用,后提出未来发展趋势及研究热点问题,有助于年轻的研究者了解整个强化学习领域,发现新的研究方向。

本书讲述了强化学习领域经典的方法及高效的解决方案框架,包括TD学习、Q学习、批处理强化学习、策略迭代的最小二乘法、模型的运用以及知识迁移,还分析了更优探索方法的理论优势以获取更好的经验。

本书还讲述了强化学习相关的概率框架和算法,包括贝叶斯强化学习框架、部分可观察的马尔可夫决策过程、可预测的状态表示、多学习器的扩展与博弈论的概念、去中心化的部分可观察的马尔可夫决策过程框架及规划算法。

本书适合作为高等院校机器学习相关课程的参考书,也可作为人工智能领域从业技术人员的参考用书。

4、下载链接

由于版权的原因,不再对外公开,仅限内部学习和交流使用。