《Hadoop+Spark大数据巨量分析与机器学习整合开发实战》林大贵, 著 9787302453758 【清华大学出版社官方正版电子书】- 文泉书局

Hadoop+Spark大数据巨量分析与机器学习整合开发实战

作者：林大贵, 著

出版社：清华大学出版社

出版日期： 2017-01-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥51.35 （ 定价：79.0 ）

支持送礼物

送给好友

收藏
加书架
引用

简介

《Hadoop + Spark 大数据巨量分析与机器学习整合开发实战》从浅显易懂的“大数据和机器学习”原理介绍和说明入手，讲述大数据和机器学习的基本概念，如：分类、分析、训练、建模、预测、机器学习（推荐引擎）、机器学习（二元分类）、机器学习（多元分类）、机器学习（回归分析）和数据可视化应用。为降低读者学习大数据技术的门槛，书中提供了丰富的上机实践操作和范例程序详解，展示了如何在单台Windows系统上通过Virtual Box虚拟机安装多台Linux虚拟机，如何建立Hadoop集群，再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校，参照书中介绍的搭建过程，同样可以将实践平台搭建在多台实体计算机上，以便更加接近于大数据和机器学习真实的运行环境。《Hadoop + Spark 大数据巨量分析与机器学习整合开发实战》非常适合于学习大数据基础知识的初学者阅读，*适合正在学习大数据理论和技术的人员作为上机实践用的教材。

更多出版物信息

版权：清华大学出版社
出版： 2017-01-01
作者：林大贵, 著
更新： 2023-06-07
书号：9787302453758
中图：TP274
学科：

工学

控制科学与工程
工学

计算机科学与技术

封面 1

扉页 2

内容简介 3

版权页 3

序 4

推荐序 6

本书章节与范例程序介绍 8

目录 12

第1章大数据与机器学习 19

第2章　VirtualBox 虚拟机软件的安装 29

第3章　Ubuntu Linux操作系统的安装 41

第4章　Hadoop Single Node Cluster 的安装 64

第5章　Hadoop Multi Node Cluster 的安装 87

第6章　Hadoop HDFS 命令 122

第7章　Hadoop MapReduce 140

第8章　Spark的安装与介绍 151

第9章　Spark RDD 177

第10章　Spark的集成开发环境 213

第11章　创建推荐引擎 254

第12章　StumbleUpon数据集 300

第13章　决策树二元分类 310

第14章　逻辑回归二元分类 344

第15章　支持向量机SVM 二元分类 355

第16章　朴素贝叶斯二元分类 364

第17章　决策树多元分类 373

第18章　决策树回归分析 391

第19章　使用Apache Zeppelin 数据可视化 412

正文结束 443

Hadoop+Spark大数据巨量分析与机器学习整合开发实战

作者信息

林大贵, 著

推荐专题

工程建模与仿真：面向智能制造的跨学科实践

正义的算法：司法变革与未来法治

数字时代的艺术生产：工具、AI与跨媒介实践

数字经济浪潮：洞察、变革与前沿

碳路新篇：战略、路径与创新

“移” 路探索：移动智能新纪元

相关图书

Hadoop+Spark大数据分析实战

Hadoop+Spark大数据分析实战

TensorFlow机器学习项目开发实战

TensorFlow机器学习项目开发实战

移动通信大数据分析——数据挖掘与机器学习实战

移动通信大数据分析——数据挖掘与机器学习实战

大数据技术与机器学习Python实战

大数据技术与机器学习Python实战

机器学习：工业大数据分析

机器学习：工业大数据分析

Python机器学习与可视化分析实战

Python机器学习与可视化分析实战

Python 3 数据分析与机器学习实战

Python 3 数据分析与机器学习实战

机器学习应用实战

机器学习应用实战

实战机器学习

实战机器学习

相关课程

大数据与机器学习微课视频（董相志）-9787302564249

Python预测分析与机器学习（9787302592549/089464-01）

Python预测分析与机器学习（9787302592549/089464-01）

分布式机器学习实战（9787302552932/085311-01）

Python快乐编程——机器学习从入门到实战-（9787302576969/084752-01）

机器学习入门到实战——MATLAB 实践应用（9787302495147/075373-01）

Hadoop+Spark大数据技术微课教程（10小时视频）（9787302514275/079663-01）

Python机器学习——数据分析与评分卡建模（微课版）（9787302516842/080057-01）

大数据智能分析-9787302572411

Java EE框架整合开发入门到实战——Spring+Spring MVC+MyBatis（微课版）（9787302502968/079720-01）