书目

数据质量导论

内容简介

本书结合国内信息环境特点,系统分析了数据质量以及数据全生命周期质量管理的内涵,构建了数据质量研究和数据清洗系统框架,并引入了数据质量管理的并行发展模式;深入研究了实体分辨、不完整数据、不一致数据三类实例层数据质量问题的数据清洗技术,提出了若干数据清洗技术方法;归纳了数据质量工具的发展概况,提出了两种数据质量工具设计方法;总结提出了大数据质量面临的十大挑战,构建了适用于国内信息环境特点的数据治理系统框架。本书内容由浅入深,系统性强,易读性和可操作性强,既可作为数据质量领域的入门和进阶用书,又可作为数据资源建设与利用、信息技术等相关学科的教学参考用书。

—  END  —