书目

强化学习

内容简介

本书作者创办了自己名字命名的研究型公司,本书涵盖了从基本的构建模块到最z先进的实践。通过本书,你将探索强化学习的当前状态、关注工业应用、学习大量算法,本书还有专门章节介绍如何将强化学习的解决方案部署到生产环节。这并不是一本随用随翻的工具书,书中包含很多数学知识,并期望读者是熟悉机器学习的。本书的主要内容有:学习强化学习是什么,以及算法如何解决具体问题。掌握强化学习的基础知识,包括马尔可夫决策过程、动态规划和时间差分算法。深入研究一系列基于值函数和政策梯度的算法。应用先进的强化学习解决方案,如元学习、分层学习、多智能体、模仿学习等。了解最z前沿的深度强化学习算法,包括Rainbow、PPO、TD3、SAC等。通过本书专门的配套网站获得实践代码和案例。

作者简介

PhilWinder博士是一名多学科交叉的软件工程师、作家和科技顾问,同时也是温德研究所的CEO。该研究所主要提供云计算科学咨询,主营业务是帮助初创公司和大型企业改进数据流程、平台以及产品。作者于英国赫尔大学获得电子工程硕士和博士学位,现居英国约克郡。译者介绍邹伟,睿客邦创始人、国内资深AI专家,擅长利用AI技术解决工业、工程中的复杂问题。华东建筑设计研究总院研究员、山东交通学院客座教授、天津大学创业导师、中华中医药学会会员,领导睿客邦与全国二十多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,目前已出版多本机器学习、深度学习领域的专著和译著。

目录

在售商品

108家店有售 新书103家
46.20
综合价格品相店铺 只看全新

—  END  —