动手学强化学习

作者：张伟楠 / 沈键 / 俞勇

出版社：人民邮电出版社

出版年：2022-02

ISBN：9787115584519

行业：化学

浏览数：27

内容简介

人工智能正在进入一个从感知智能、认知智能向决策智能发展的时代！

强化学习是一种面向决策型人工智能的方法，将更多权力交给机器，让机器在各种任务中直接完成决策，不再以辅助的角色为人或者其他下游逻辑服务。

◎ 编辑推荐

本书全面、系统地介绍强化学习的基础理论体系，指明强化学习的入门及进阶路径。

本书配套线上代码实践平台，将纸质图书、在线代码运行环境、视频课程、在线讨论区、自主练习等多种内容形式融为一体，创造了能够将强化学习的原理和实践无缝衔接的学习环境，能够满足人工智能领域从学生到教师，再到行业的开发和研究人员的多种学习需求。

·名家作品：上海交通大学ACM班创始人俞勇教授、博士生导师张伟楠副教授、APEX实验室博士生沈键编写。

·理论与实践并重：基于上交大ACM 班的人工智能专业课程构建强化学习的学习体系，理论扎实、落地性强。

·配套资源丰富：在线代码运行环境+在线视频课程+在线讨论区+在线习题+配套课件。

·多位业内大咖力荐：字节跳动人工智能实验室总监李航|1986年图灵奖得主John Hopcroft|北京大学数学科学学院统计学教授张志华|伦敦大学学院计算机科学系讲席教授汪军|亚马逊资深首席科学家、《动手学深度学习》作者李沐。

◎ 内容简介

本书系统地介绍了强化学习的原理和实现，是一本理论扎实、落地性强的图书。

本书包含3个部分：第一部分为强化学习基础，讲解强化学习的基础概念和表格型强化学习方法；第二部分为强化学习进阶，讨论深度强化学习的思维方式、深度价值函数和深度策略学习方法；第三部分为强化学习前沿，介绍学术界在深度强化学习领域的主要关注方向和前沿算法。同时，本书提供配套的线上代码实践平台，展示源码的编写和运行过程，让读者进一步掌握强化学习算法的运行机制。

◎ 名人推荐

本书全面、系统地介绍了强化学习的基本技术，能够帮助读者学习强化学习的基本概念及其代表性方法，并涉及模仿学习、多智能体强化学习等前沿技术。作者搭建了与本书内容配套的在线实践学习平台，读者能够在线运行代码并与同行交流、讨论，加强对强化学习技术的理解和掌握。本书凝结了强化学习领域的知识精华，是人工智能算法工程师必读的好书。

——李航字节跳动人工智能实验室总监

本书的一个重要特点是实现了理论与代码的有机结合，学生在学习强化学习的主要概念时，可以方便地使用这些代码。本书得到了上海交通大学学生的广泛好评。

——John Hopcroft 1986年ACM图灵奖得主、上海交通大学校长特别顾问

强化学习对初学者来说有较高的学习门槛，容易让人却步。本书给出了各个算法的可执行代码，帮助读者快速上手尝试，拉近了讲授内容与读者的距离，是入门强化学习的必备参考教材。

——俞扬南京大学人工智能学院教授

本书源自上海交通大学ACM班的人工智能专业课程。上海交通大学ACM班创始人俞勇教授及其团队将其在人工智能领域多年深耕的成果汇集成书，并精心开发了满足年轻人才学习需求的多种学习资源，将理论知识、在线代码、项目实训有机融合，能够帮助读者从零搭建起强化学习的理论与工程体系。本书真正从社会需求出发，为人工智能领域相关专业的人才培养提供了非常有价值的参考，也为高校学生和行业从业人员深入研究、创新强化学习技术指明了路径。

——张志华北京大学数学科学学院统计学教授

在几次举办RLChina强化学习暑期夏令营的过程中，我感受到中国学生对强化学习这一学科的学习热情十分高涨，每次活动的参与人数都过万。但是，目前中国在强化学习领域的专业教师资源紧缺，导致学生对强化学习理论知识的掌握不够到位；强化学习实验室资源不足，学生在实验过程中容易遇到各种难以解决的问题，但缺少有效提升实验效率的标程或沟通渠道。本书可以让学生在理论学习与代码实践之间无缝衔接，这很好地解决了学习和研究强化学习的痛点。在此将本书推荐给每一位学习和研究强化学习的学生和教师。

——汪军伦敦大学学院计算机科学系讲席教授

强化学习是近年来的热门方向，突破性方法和亮眼应用频出。本书将理论与实践相结合，既讲解了算法，又展示了代码实现，是一本不可多得的强化学习教科书，强烈推荐！

——李沐亚马逊资深首席科学家

......(更多)

作者简介

张伟楠，上海交通大学副教授，博士生导师，ACM班机器学习、强化学习课程授课老师，吴文俊人工智能优秀青年奖、达摩院青橙奖得主，获得中国科协“青年人才托举工程”支持。他的科研领域包括强化学习、数据挖掘、知识图谱、深度学习以及这些技术在推荐系统、搜索引擎、文本分析等场景中的应用。他在国际一流会议和期刊上发表了100余篇相关领域的学术论文，于2016年在英国伦敦大学学院（UCL）计算机系获得博士学位。

沈键，上海交通大学APEX实验室博士生，师从俞勇教授，研究方向为深度学习、强化学习和教育数据挖掘。在攻读博士期间，他以第一作者身份发表机器学习国际顶级会议NeurIPS、AAAI论文，参与发表多篇机器学习和数据挖掘国际顶级会议（包括ICML、IJCAI、SIGIR、KDD、AISTATS等）论文，并担任多个国际顶级会议和SCI学术期刊的审稿人。

俞勇，享受国务院特殊津贴专家，国家级教学名师，上海交通大学特聘教授，APEX实验室主任，上海交通大学ACM班创始人。俞勇教授曾获得首批“国家高层次人才特殊支持计划”教学名师、“上海市教学名师奖”“全国师德标兵”“上海交通大学校长奖”和“最受学生欢迎教师”等荣誉。他于2018年创办了伯禹人工智能学院，在上海交通大学ACM班人工智能专业课程体系的基础上，对AI课程体系进行创新，致力于培养卓越的AI算法工程师和研究员。

......(更多)