《Hadoop+Spark大数据分析实战》迟殿委 9787302608844 【清华大学出版社官方正版电子书】- 文泉书局

Hadoop+Spark大数据分析实战

作者：迟殿委

出版社：清华大学出版社

出版日期： 2022-07-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥24.15 （ 定价：69.0 ）

支持送礼物

送给好友

收藏
加书架
引用

简介

本书是Hadoop + Spark大数据分析技术入门书，基于Hadoop和Spark两大框架体系的3.2版本，以通俗易懂的方式介绍Hadoop + Spark原生态组件的原理、集群搭建、实战操作，以及整个Hadoop生态系统主流的大数据分析技术。本书共分14章。第1章讲解Hadoop框架及新版本特性，并详细讲解大数据分析环境的搭建工作，包括Linux操作系统的安装、SSH工具使用和配置等；第2章讲解Hadoop伪分布式的安装和开发体验，使读者熟悉Hadoop大数据开发两大核心组件，即HDFS和MapReduce；第3~12章讲解Hadoop生态系统各框架HDFS、MapReduce、输入输出、Hadoop集群配置、高可用集群、HBase、Hive、数据实时处理系统Flume，以及Spark框架数据处理、机器学习等实战技术，并通过实际案例加深对各个框架的理解与应用；第13~14章分别通过影评分析、旅游酒店评价分析实战项目来贯穿大数据分析的完整流程。本书可以作为大数据分析初学者的入门指导书，也可以作为大数据开发人员的参考手册，同时也适合作为高等院校大数据相关专业的教材或教学参考书。

编辑推荐

本书全面讲解Hadoop生态圈各组件的核心知识、操作和分析技术，系统介绍Spark框架搭建、操作和典型的机器学习分析技术。最后通过两个综合实战项目——影评分析、旅游酒店评价分析，来贯穿大数据分析的完整流程。

更多出版物信息

版权：清华大学出版社
出版： 2022-07-01
作者：迟殿委
更新： 2023-06-19
书号：9787302608844
中图：TP274
学科：

工学

控制科学与工程
工学

计算机科学与技术

封面页 1

书名页 2

版权页 3

内容简介 4

前言 5

目录 6

第1章　大数据与Hadoop 7

第2章　Hadoop伪分布式集群 20

第3章　HDFS分布式文件系统 29

第4章　分布式运算框架MapReduce 37

第5章　Hadoop输入输出 51

第6章　Hadoop分布式集群配置 63

第7章　Hadoop高可用集群搭建 66

第8章　数据仓库Hive 74

第9章　HBase数据库 91

第10章　Flume数据采集 105

第11章　Spark框架搭建及应用 119

第12章　Spark机器学习 147

第13章　影评分析项目实战 160

第14章　旅游酒店评价分析项目实战 176

Hadoop+Spark大数据分析实战

作者信息

迟殿委

推荐专题

工程建模与仿真：面向智能制造的跨学科实践

正义的算法：司法变革与未来法治

数字时代的艺术生产：工具、AI与跨媒介实践

数字经济浪潮：洞察、变革与前沿

碳路新篇：战略、路径与创新

“移” 路探索：移动智能新纪元

相关图书

Flink大数据分析实战

Flink大数据分析实战

Spark大数据分析实战

Spark大数据分析实战

Hadoop大数据分析实战

Hadoop大数据分析实战

大数据分析与应用实战

大数据分析与应用实战

Spark大数据分析与实战

Spark大数据分析与实战

Hadoop+Spark大数据巨量分析与机器学习整合开发实战

Hadoop+Spark大数据巨量分析与机器学习整合开发实战

Spark入门与大数据分析实战

Spark入门与大数据分析实战

Hive入门与大数据分析实战

Hive入门与大数据分析实战

Hadoop+Spark大数据技术（微课版）

Hadoop+Spark大数据技术（微课版）

相关课程

Hadoop+Spark大数据技术微课教程（10小时视频）（9787302514275/079663-01）

Python数据分析实战——从Excel轻松入门Pandas（9787302602811/093020-01）

Python Web数据分析可视化——基于Django框架的开发实战（9787302600879/091536-01）

大数据智能分析-9787302572411

数理统计与MATLAB数据分析（第2版）

从Excel到Python数据分析（9787302640943/102334-01）

破解生死大数据（有声书）

大数据与机器学习微课视频（董相志）-9787302564249

Python全栈开发——数据分析（9787302625001/093015-01）

智能车间的大数据应用（9787302546498/078292-01）