Spark实战(第2版)

作者: [法]吉恩·乔治·佩林(Jean-Georges Perrin) 著 林赐 译

出版社: 清华大学出版社

出版日期: 2022-03-01

电子书 暂不销售 定价:99.8
  • 收藏

  • 加书架

  • 引用

简介

主要内容: 用Java编写的Spark应用程序; Spark应用架构; 提取文件、数据库、数据流和Elasticsearch的数据; 使用Spark SOL查询分布式数据集

编辑推荐

企业数据的分析始于读取、过滤和合并来自多个数据源的文件和数据流。Spark数据处理引擎是这方面的佼佼者,可处理各种量级的数据,其传输速度比Hadoop 系统快100倍。得益于SQL的支持、直观的界面和简单的多语言API,你可轻松使用Spark,而不必学习复杂的新型生态系统。 《Spark实战(第2版)》将引导你创建端到端分析应用程序。在本书中,你可学习基于Java的有趣示例,包括用于处理NASA卫星数据的完整数据管道。你还可查看托管在GitHub.上的有关Java、Python和Scala的代码示例, 并探索、修改此代码。此外,本书的附录为你提供速查表,帮助你安装工具和理解特定的Spark术语。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2022-03-01
  • 作者:[法]吉恩·乔治·佩林(Jean-Georges Perrin) 著 林赐 译
  • 更新: 2023-06-19
  • 书号:9787302596783
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术