书目

机器学习与R语言实战

内容简介

现在,越来越多的人开始接触并考虑引入大数据技术来促进公司产品的销售以获得更多利润,而机器学习已经成为除统计以外一种新的分析方法,采用学习算法既能提高数据模型的预测精准度,又确保了对商务活动及其发展过程的预测能够脱离人脑计算能力的局限,使面向大数据的分析处理在依托计算机大规模计算能力下得以完成。本书由资深数据科学家亲笔撰写,借助当前机器学习和数据分析领域*常用的工具R语言,深入浅出地介绍了采用R语言进行数据分析及构建预测模型的100多种实用方法,包括分类、回归、聚类、关联分析等常用机器学习算法的实现,每一个算法都通过具体案例详细说明构建模型、实现模型以及评价模型的过程。而且书中还系统讲解了相关的R语言基础知识,包括环境准备以及数据转换、分析和结果可视化的方法。此外,还详细展示了使用RHadoop处理和分析海量数据的过程。本书融合了作者在实践机器学习算法来完成数据分析方面的诸多心得,并且书中所有源代码和实验数据在配套的网站上都可以免费下载,相信阅读完本书并亲自动手完成书中所有算法案例后,你将对机器学习和R语言都有更深入的了解,设计学习算法来发现隐藏在数据中有价值的模式也不再是遥不可及的目标。本书共11章。第1章介绍如何创建一个可用的R环境和基本的R命令;第2章讲述如何使用R语言进行探索性数据分析;第3章重点探讨数据采样和概率分布的概念;第4章探讨因变量和解释变量集合之间的线性关系;第5章介绍基于树的分类器:K近邻分类器、逻辑回归分类器以及朴素贝叶斯分类器;第6章神经网络和支持向量机;第7章展示一些模型评估的方法;第8章探讨集成分类器;第9章讲述多种聚类算法;第10章介绍关联分析和序列挖掘;第11章介绍如何从原始变量中选择和抽取特征;第12章讨论大数据分析(R和Hadoop)。

作者简介

丘祐玮(Yu-WeiChiu)LargitData公司创始人,资深数据科学家,之前曾就职于TrendMicro公司,主要负责为商务智能及客户关系管理系统构建大型数据处理平台。他专注于在数据分析中使用Spark和Hadoop技术来实现海量数据挖掘。同时,他还是一位资深讲师,在各类Python、R、Hadoop及相关会议上多次分享技术报告。

目录

丛书

数据分析与决策技术丛书

—  END  —