书目

大数据实践

内容简介

本书内容涵盖了目前使用*为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和SparkSQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装部署方式给出了详细步骤,常用命令也都有具体示例介绍,是一本实操性很强的工具书,能帮助初学者快速掌握这几款常用的大数据处理系统。本书以浅显易懂的语言风格和图文并茂的操作示例引领读者迈入大数据实践之门,可以作为培养应用型人才的课程教材,也可作为开发人员的自学教材和参考手册。

作者简介

袁晓东-数据库和大数据专家,1998年毕业于南京大学计算机系,获软件博士学位。曾任职于Oracel公司纽约分部、趋势科技南京研发中心,现为南京市领军型科技创业人才,云白科技创始人,江苏省计算机学会软件专委会委员,东南大学研究生院校外导师。  

目录

—  END  —