Spark SQL入门与实践指南

作者: 纪涵、靖晓文、赵政达

出版社: 清华大学出版社

出版日期: 2018-04-01

电子书 ¥29.4 定价:49.0 纸书价格¥44.80,点此比价
  • 收藏

  • 加书架

  • 引用

简介

Spark SQL是 Spark大数据框架的一部分,支持使用标准SQL查询和HiveQL来读写数据,可用于结构化数据处理,并可以执行类似SQL的Spark数据查询,有助于开发人员更快地创建和运行Spark程序。 全书分为4篇,共9章,第一篇讲解了Spark SQL 发展历史和开发环境搭建。第二篇讲解了Spark SQL 实例,使得读者掌握Spark SQL的入门操作,了解Spark RDD、DataFrame和DataSet,并熟悉 DataFrame 各种操作。第三篇讲解了基于WiFi探针的商业大数据分析项目,实例中包含数据采集、预处理、存储、利用Spark SQL 挖掘数据,一步一步带领读者学习Spark SQL强大的数据挖掘功能。第四篇讲解了Spark SQL 优化的知识。 本书适合Spark初学者、Spark数据分析人员以及Spark程序开发人员,也适合高校和培训学校相关专业的师生教学参考。

编辑推荐

适读人群 :Spark初学者、Spark数据分析人员以及Spark程序开发人员 (1)讲解Spark SQL背景知识、编程基础 (2)通过一个工程实例让读者领略Spark SQL强大简便的分析能力 (3)学习构建一个大数据实际应用的方法,加强工程思维 (4)洞悉Spark的调优方式及其思想,让Spark SQL程序高效运行

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2018-04-01
  • 作者:纪涵、靖晓文、赵政达
  • 更新: 2023-07-10
  • 书号:9787302496700
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

纪涵、靖晓文、赵政达

纪 涵,数据挖掘、云计算爱好者,曾负责多个中小型网站的开发维护工作,曾参与开发设计多款面向校园服务的App,参与开发设计过多个基于Hadoop、Spark平台的大数据应用,有着丰富的流数据、结构化数据处理经验,现主要研究方向为机器学习、数据挖掘。

相关图书