复杂数据质量控制技术

作者: 曹建军 郑奇斌 刘艺 翁年凤

出版社: 清华大学出版社

出版日期: 2023-09-01

  • 优惠券
  • ¥3
    ¥10
    ¥30
    ¥70
  • 领券
电子书 ¥109.2 定价:168.0
  • 收藏

  • 加书架

  • 引用

简介

复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。 全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展; 第2部分实体分辨技术(第3~13章),研究了高维数据实体分辨、名称分辨、XML数据实体分辨和跨模态数据实体分辨等; 第3部分真值发现技术(第14~18章),研究了单真值发现、多真值发现、文本数据真值发现,以及基于多蚁群优化和基于深度神经网络的真值发现等; 第4部分基于数据依赖的数据质量控制技术(第19~21章),研究了数据录入辅助预测与推理方法、不一致数据检测与修复方法,以及有限先验知识下的全局数据质量评估; 第5部分系统与平台(第22、23章),介绍了数据质量控制系统,以及数据治理平台的设计与实现; 第6部分结束语(第24章),归纳总结了当前面临的风险和挑战。 本书务实求新,系统性强,易读性和可操作性好,既可作为数据质量控制与数据治理领域的进阶用书,又可作为数据资源建设与利用、信息技术等相关学科领域的教学参考或工程实践指导用书。

编辑推荐

本书内容丰富,详细介绍了数据资源建设与利用,以及最新的信息技术。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-09-01
  • 作者:曹建军 郑奇斌 刘艺 翁年凤
  • 更新: 2023-12-15
  • 书号:9787302623342
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

曹建军 郑奇斌 刘艺 翁年凤

曹建军,工学博士,博士后,现任国防科技大学第六十三研究所数据工程研究室副研究员、硕士生导师,兼任南京信息工程大学博士生导师。长期从事数据质量控制与数据治理、智能数据分析与应用研究,2008年组建信息质量研究组(IQRG)。获中国博士后科学基金特别资助,授权发明专利7项,出版专译著6本,发表论文90余篇。

相关图书