【赠书】深度强化学习落地指南,来自一线工程师的经验!
本书内容
本书一共分为7章,包括强化学习的需求分析和算法选择的方法,动作空间、状态空间和回报函数设计的理念,训练调试和性能冲刺的技巧等。
第1章:需求分析,介绍了强化学习的基本概念,为什么要使用强化学习,以及强化学习可以做的事情。
第2章:动作空间设计,包括动作空间的完备性,动作空间的高效性,动作空间的合法性。
第3章:状态空间设计,包括状态空间设计的四个步骤划分,状态空间设计的两种常见误区,与动作空间和回报函数的协同设计 。
第4章:回报函数设计,包括回报函数的基本设计,回报函数设计的常见陷阱,基于学习的回报函数。
第5章:算法选择,介绍包括DQN,DDPG,A3C等经典算法,以及TD3,SAC,PPO等更新的算法。
第6章:训练调试,包括训练前的准备工作,如数据预处理 ,训练过程中的超参数调节,如何监控训练状态。
第7章:性能冲刺,包括课程学习,额外监督信号的使用,进化策略方案。
作者简介
魏宁:本科和硕士分别毕业于西安交通大学和中国科学院大学计算机专业,在国际顶级会议和期刊上发表多篇学术论文,曾就职于德国KUKA Robotics从事协作机器人智能应用研发工作,目前在海康威视研究院任算法专家,负责深度学习、强化学习等领域的创新研究和落地应用,同时也是互联网社区“深度强化学习实验室”核心成员。
本书特点
本书从工业界一线算法工作者的视角,对深度强化学习落地实践中的工程经验和相关方法论做出了深度思考和系统归纳。本书跳出了原理介绍加应用案例的传统叙述模式,转而在横向上对深度强化学习落地过程中的核心环节进行了完整复盘。主要内容包括需求分析和算法选择的方法,动作空间、状态空间和回报函数设计的理念,训练调试和性能冲刺的技巧等。
赠书
接下来是福利时间,本次我们赠送出3本书籍(前5次获得赠书的朋友不能再参与本次赠书活动),想要获得书籍的同学,在本公众号下方留言,根据点赞数的高低,下周二晚上(9.28)22:00统计出获奖读者并进行公示,届时联系有三微信Longlongtogo即可。
如果没有获得赠书,也可以在京东和当当购买,链接如下: