Spark高级数据分析第2版

作者 [美]乔希·威尔斯著[美]桑迪·里扎译[美]于里·莱瑟森译[英]肖恩·欧文译龚少成译邱鑫译
出版社人民邮电出版社
出版时间 2018年6月第2版
ISBN 9787115482525
定价 69.00

内容简介

本书是使用Spark进行大规模数据分析的实战宝典，由知名数据科学家撰写。本书在第1版的基础上，针对Spark近年来的发展，对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API，MLlib和SparkSQL两个子项目也发生了较大变化，本书为关注Spark发展趋势的读者提供了与时俱进的资料，例如Dataset和DataFrame的使用，以及与DataFrameAPI高度集成的SparkMLAPI。

作者简介

【作者简介】桑迪·里扎（SandyRyza），Spark项目代码提交者、Hadoop项目管理委员会委员，TimeSeriesforSpark项目创始人。曾任Cloudera公司高级数据科学家，现就职于Remix公司从事公共交通算法开发。于里·莱瑟森（UriLaserson），MIT博士毕业，致力于用技术解决遗传学问题，曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。目前是西奈山伊坎医学院遗传学助理教授，曾任Cloudera公司核心数据科学家。肖恩·欧文（SeanOwen），Spark、Mahout项目代码提交者，Spark项目管理委员会委员。现任Cloudera公司数据科学总监。乔希·威尔斯（JoshWills），Crunch项目发起人，现任Slack公司数据工程主管。曾任Cloudera公司高级数据科学总监。【译者简介】龚少成现任万达科技集团数据工程部总经理，清华大学自动化系研究生毕业，国内专注企业级大数据平台建设的先驱者之一，曾经在Intel和Cloudera公司担任大数据技术负责人，Cloudera公司认证大数据培训讲师。邱鑫毕业于武汉大学，目前就职于英特尔亚太研发有限公司，是Intel大数据团队高级工程师。主要研究大数据与深度学习技术，是基于Spark的深度学习框架BigDL的核心贡献者。

Spark高级数据分析 第2版

内容简介

作者简介

目录

Spark高级数据分析第2版