《大数据开发基础与实践(微课版)》从初学者角度详细介绍了大数据开发的基础知识和对应的项目开发实践。全书共七个项目开发案例。第一个项目是大数据集群环境搭建,包括Linux虚拟机、JDK环境、Zookeeper、Hadoop、HBase、Spark等平台的安装和配置;第二个项目是数据仓库构建,包括MySQL、Hive的安装与配置;第三个项目是Java访问Hadoop实践,包括Java访问HDFS文件系统和MapReduce编程实践;第四个项目是大数据采集实践,包括利用Python编程语言、Request库采集网页数据,并介绍利用XPath等技术对数据进行采集的方法;第五个项目是大数据清洗实践,包括利用编程方式和Kettle工具对数据进行清洗;第六个项目是大数据分析实践,包括利用Hive和Spark对数据进行清洗;第七个项目是大数据可视化实践,包括利用Excel和ECharts对数据进行可视化。 通过以上七个项目的开发与应用实践,将会提高读者的大数据开发应用实践能力。《大数据开发基础与实践(微课版)》配备教学PPT、教学视频、教学补充案例等资源。为了帮助读者更好地学习书中的内容,还提供了在线答疑。 《大数据开发基础与实践(微课版)》基础理论与实践相结合,内容深入浅出,并配合实际的项目,适合致力于大数据开发方向的编程爱好者使用,也适用于高职高专以及应用型本科学生作为大数据教程。
《大数据开发基础与实践(微课版)》重点围绕Hadoop 3.0版本集群环境的搭建为基础,介绍Hadoop的三大组件HDFS、MapReduce、YARN,突出其原理和编程实践,通过实例介绍HDFS的存储原理,再介绍通过MApReduce来实现离线计算。此外再介绍与Hadoop紧密相联系的两个平台列式数据库HBASE和Hive数据仓库,分别介绍其安装配置、存储、分析使用原理,适合大数据专业学生作为专业教材和大数据入门爱好者作为学习指导书。并且配套资源丰富,本书提供教学大纲、教学课件、电子教案、习题解答、程序源码等多种教学资源,对重要的知识点和操作方法并提供视频讲解,扫描书中对应的二维码可以在线观看、学习。
- 版权: 清华大学出版社
- 出版: 2022-06-01
- 更新: 2023-07-19
- 书号:9787302606932
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术