简介
本书系统介绍了Spark大数据处理框架以及相应的主流开发语言Scala。全书共14章,内容包括Scala基本概念和基本用法,Scala字符串和数组,Scala控制结构,Scala列表、元组、集合和映射,Scala函数,Scala面向对象编程,Spark大数据处理框架、Spark RDD编程,Windows环境下的Spark综合编程,用Spark SQL处理结构化数据,Spark Streaming流处理,Spark Structured Streaming流处理,Spark GraphX图计算,Spark ML机器学习。 本书可作为高等院校计算机科学与技术、信息管理、软件工程、数据科学与大数据、人工智能等相关专业的大数据课程教材,也可供企业中从事大数据开发的工程师和科技工作者参考。
编辑推荐
l 内容系统全面:全面阐明Spark3.2生态组件 l 理论实践结合:配丰富案例实践每章知识点 l 原理浅显易懂:对操作给出示例代码和注解 l 入门门槛较低:零基础轻松快速掌握Spark l 教材配套资源:教学课件、源代码、教学视频
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2023-11-01
- 更新: 2024-09-27
- 书号:9787302644293
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术