书目

数据科学概论(数据科学与大数据技术丛书)

内容简介

作为问题导向、数据驱动的交叉学科,数据科学要求研究者具备扎实的知识储备、高效的编程能力以及广阔的研究视野。本书尝试以概论的形式对数据科学的缘起、内涵、技术、工具、原则、方法、平台、产品、应用等展开讨论,帮助读者建立完整的知识体系与专业逻辑。全书划分为四个部分:*部分是绪论,鸟瞰数据科学的概念、历史与应用;第二部分是基础技能,涵盖编程工具、数学基础与统计原则;第三部分是分析方法,遵从从探索性到验证性的数据分析思路,阐释数据可视化方法,讲解面向结构化数据的机器学习与人工智能模型,并讨论非结构化数据的分析技术;第四部分是数据应用,从业界视角介绍数据库、大数据平台、可重复研究的理念与实践,并以互联网、零售、金融、医疗健康四个行业为例展开实战讨论。

作者简介

李扬中国人民大学统计学院教授、博士生导师,副院长、统计咨询研究中心主任;国际统计学会推选会员、中国商业统计学会副会长、北京生物医学统计与数据管理研究会监事长、北京大数据协会综合评价专业委员会主任委员。主要从事相关型数据分析、模型选择与不确定性评价、潜变量建模、临床试验设计等领域研究,承担国家自然科学基金面上项目、全国统计科学研究重大项目等科研项目二十余项,发表JASA、JAMA?IM、Biometrics、Biostatistics、统计研究等国内外期刊研究论文五十余篇。李舰统计学本科、软件工程硕士、商学博士,数据科学领域的多年从业者,见证并参与了统计学从冷门专业到显学的过程。是“统计之都”社区的核心成员之一、一些开源社区的活跃贡献者,致力于数据科学在实体行业的应用。著有《统计之美》《数据科学中的R语言》。

目录

—  END  —