Hadoop+Spark大数据技术(微课版)

作者: 刘彬斌主编,李柏章、周磊、李永富编著

出版社: 清华大学出版社

出版日期: 2018-11-01

电子书 ¥45.54 定价:69.0 纸书价格¥52.90,点此比价
  • 收藏

  • 加书架

  • 引用

本书特色
新形态教材
亮点
课件 视频资源 案例解析 其他素材
简介

全书内容分为大数据系统基础、Hadoop技术、Spark技术和项目实战4部分。其中,Linux是学习大数据技术的基础,先从Linux入手,打下坚实的基础,之后才能更好地学习Hadoop和Spark。4部分内容分别介绍如下。   大数据系统基础篇通过大数据概述、Linux系统安装、Linux系统基础命令、Shell编程和MySQL数据操作,为以后编程奠定坚实的基础。   Hadoop技术篇以Hadoop生态圈为中心,详细介绍Hadoop高可用集群搭建、HDFS技术、MapReduce技术、Hive技术,为读者学习大数据开发技术提供便利,并以实用的方式简单介绍HBase、Sqoop、Flume工具的使用,使读者在精通一门技术的前提下,能扩展了解相关知识,真正成为一专多能的专业型人才。   Spark技术篇从Spark概述、Scala语言、环境搭建、RDD核心技术、Spark SQL和机器学习等多方面讲解Spark大数据的开发,从基础的Scala语言开始学习,并以Hadoop环境为基础搭建Spark大数据集群,从最基础、最常用、最容易理解的思路出发,帮助读者逐步掌握Spark大数据技术。   项目实战篇从真实项目“电力能源大数据分析”中抽取一部分业务作为实战解读,通过简洁的流程讲解,使读者了解大数据项目开发的整个过程。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2018-11-01
  • 作者:刘彬斌主编,李柏章、周磊、李永富编著
  • 更新: 2023-07-21
  • 书号:9787302514275
  • 中图:TP274
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

相关图书