本书围绕大数据背景下的数据挖掘及应用技术,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍大数据挖掘分析过程中的数据认知与预处理、数据可视化技术、数据挖掘的基本方法、Hadoop大数据分布式处理生态系统及分析应用等内容。其中数据挖掘的基本方法不仅包括数据关联分析、数据分类分析及数据聚类分析,还包括深度学习等重要的数据挖掘研究和发展主题。作者对每一章的内容都尽量从不同的角度进行深入剖析,案例均采用Python语言编程。 本书既可以面向计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等信息类专业的本科生和研究生,也可以面向广大的IT从业人员。全书不仅提供了全部案例的Python源代码,还提供了丰富的习题和参考文献,对读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。
全书分导论、方法论和进阶应用三大部分,共10章,涵盖数据分析的数据预处理、关联规则分析方法、有标签的数据分析方法、无标签的数据分析方法、数据可视化技术、深度学习技术、Hadoop大数据分布式应用计算平台等基础知识。 本书内容以大数据分析流程为导引,结合一系列案例和学生竞赛作品,将数据分析技术的应用过程,由浅入深地把理论融入实践,激发读者浓厚的学习热情,加深读者对知识的认识、理解和掌握。 全书所有案例均采用Python语言编写,不仅包括简单程序的代码,也包括较大应用程序代码,所有代码都全部经过验证,适合初学者学习和实现。案例代码可以登录清华大学出版社网站(http://www.tup.com.cn)下载。 可作为高等院校以及高职高专学校的计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等相关信息类专业的教材,也可作为学习数据分析应用技术的参考书使用。 本书是国家级一流本科线上课程《大数据分析与处理》在线微视频开放课程的配套教材,也是重庆市一流本科线上线下混合式课程《数据挖掘基础》的配套教材。
- 版权: 清华大学出版社
- 出版: 2021-10-01
- 更新: 2023-06-07
- 书号:9787302585701
- 中图:TP274-43
- 学科:工学控制科学与工程工学计算机科学与技术