Hadoop+Spark+Python大数据处理从算法到实战

作者朱春旭
出版社北京大学出版社
出版时间 2021年6月第1版
ISBN 9787301321447
定价 99.00

内容简介

本书围绕新基建的云计算、大数据及人工智能进行介绍，分为以下五个部分。部分介绍大数据的概念与特点，以及典型的产业应用场景；第二部分介绍目前云计算中的一个重要的研究与应用领域—容器云，包含应用容器引擎Docker与容器编排工具Kubernetes；第三部分是大数据分析的基础，也是大数据分析技术的重点，包含Hadoop、HBase、Hive、Spark的环境搭建及开发流程；第四部分是机器学习相关算法的应用，包含scikit-learn、SparkML、TensorFlow工具的使用；第五部分，以实例介绍如何使用Spark机器学习库中的协同过滤算法，来实现一个基于Web的推荐系，以及介绍如何使用OpenCV与TensorFlow构建卷积神经网络来实现基于Web的人脸识别。本书轻理论，重实践，适合有一定编程基础，且对云计算、大数据、机器学习、人工智能感兴趣，希望投身到新基建这一伟大事业的读者学习。同时，本书还可作为广大院校相关专业的教材和培训参考用书。

作者简介

朱春旭，高级软件工程师，长期为软件开发公司、政府机构培训大数据开发与应用课程，提供大数据技术咨询与问题解决方案，对Python、大数据分析相关领域有深入研究。著有《Python编程完全自学教程》《Python数据分析与大数据处理从入门到精通》，培训学员10000。

Hadoop+Spark+Python大数据处理从算法到实战

内容简介

作者简介

目录