书目

大数据分析原理与实践

内容简介

本书介绍了大数据分析的多种模型、所涉及的算法和技术、实现大数据分析系统所需的工具以及大数据分析的具体应用。本书共16章。第1章为绪论,就大数据、大数据分析等概念进行了阐释,并对本书内容进行了概述;第2~7章介绍了关联分析模型、分类分析模型、聚类分析模型、结构分析模型和文本分析模型;第8章介绍大数据分析的数据预处理问题;第9章介绍降维方法;第10章介绍了数据仓库的概念、内涵、组成、体系结构和建立方法,还介绍了分布式数据仓库系统和内存数据仓库系统。第11章介绍大数据分析算法中的回归算法、关联规则挖掘算法、分类算法以及聚类算法的实现。第12~14章介绍了三种用于实现大数据分析算法的平台,即并行计算平台、流式计算平台和大图分析平台。第15章和第16章介绍两类大数据分析的具体应用,分别讲述了社会网络分析和推荐系统。本书可作为高等院校大数据相关专业的教学用书,也可以作为从事大数据相关工作的工程技术人员的参考用书。

作者简介

王宏志,博士,博士生导师,哈尔滨工业大学计算机科学与技术学院副教授,中国计算机学会高级会员,YOCSEF黑龙江省分论坛AC。2008年7月在哈尔滨工业大学计算机软件与理论学科获得博士学位,博士论文获得“中国计算机学博士论文”和“哈尔滨工业大学博士论文”。研究方向包括XML数据管理、图数据管理、数据质量、信息集成等。先后被评为“微软学者”、“中国数据库工程师”和“IBM博士英才”。曾先后担任全国数据库会议等多个学术会议的程序委员会委员和IEEETKDE等多个重要国际期刊的审稿人。

目录

丛书

数据科学与工程技术丛书

—  END  —