《大数据系列丛书:大数据挖掘及应用》围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍了大数据挖掘分析过程中的数据准备和预处理方法、数据可视化技术、数据挖掘理论和经典算法、常用大数据分析计算平台的编程模型、并行化程序设计技术、统计分析R语言基础等内容。其中数据挖掘理论和经典算法不仅覆盖了传统的关联分析、分类和聚类,还包括深度学习理论等数据挖掘研究和发展的潮流主题。每一章内容都尽量从不同角度进行深入浅出的剖析,还配以丰富的习题和参考文献,对于读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。 《大数据系列丛书:大数据挖掘及应用》可以作为高校本科相关专业数据分析类课程教材和面向各专业的数据科学通识教材,也可供广大IT从业人员参考。
“大数据系列丛书”由多本既独立又有丰富内在联系的大数据时代思维、技术与应用的教材组成。《大数据挖掘及应用》是其中的又一力作。 本书内容宽泛,图文并茂,文字流畅,技术先进,是全新设计的数据挖掘及应用课程的教材,适合不同层次读者的学习需要。 全书分导论、方法论和进阶应用三大部分,共11章,涵盖大数据挖掘及应用领域的基础理论知识和方法、数据可视化技术、深度学习技术、R语言基础、大数据分析算法的并行化基础理论,大数据分布式存储与并行计算平台及编程框架等重要概念。 全书提供大量案例,不仅包括简单程序的代码,也包括较大应用程序代码,结合一系列案例和学生竞赛作品,把数据分析技术的概念、理论融入实践中。每章配有习题,以加深对知识的认识、理解和掌握,激发读者浓厚的学习兴趣,巩固所学知识,提高编程能力。 本书可作为高等院校计算机、软件工程、大数据等专业的教材,也可作为教辅资料,还可作为学习应用技术的参考书。 以本书内容为主题的在线微视频开放课程已经在http://cqupt.gaoxiaobang.com上线。与本书配套的电子课件,每章案例涉及的软件程序、课后习题解答及部分案例的演示视频均可登录清华大学出版社网站下载使用。
- 版权: 清华大学出版社
- 出版: 2017-07-01
- 更新: 2023-06-07
- 书号:9787302469278
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术