简介
本书内容分为三个部分,第一部分为互联网大数据的概述;第二部分为互联网大数据的获取与存储,包括了静态或动态WEB页面内容获取技术、结构化或非结构化数据的存储、常见的开源系统等;第二部分为处理与分析技术,包括了文本数据预处理、数据内容的语义分析技术、文本内容分类技术、聚类分析、大数据中的隐私保护、大数据可视化等内容;第三部分为综合应用。
编辑推荐
1.针对互联网大数据,从大数据的获取到可视化展示与发布的整个过程,帮助读者建立完整的知识体系。侧重于非结构化数据处理与分析,有助于读者接触到更多的大数据核心关键技术。 2.各章节融入了作者在教学和科研中所积累的一些值得深入探讨的问题和观点,具有一定的启发性。 3.理论与实践相结合,各个章节包含有技术原理介绍,也包含实现技术、开源架构等方面的叙述,使得读者能从中掌握技术应用及实现方法。 4.注重产学结合,基于阿里云及其大数据平台,构建了综合应用实例,有效地集成运用了本书的一些关键技术,帮助读者深入理解大数据处理技术。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2017-04-01
- 更新: 2023-06-07
- 书号:9787302463719
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术