简介
Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive能将结构化的数据文件映射为一张数据库表,并能提供SQL查询分析功能,将SQL语句转换成MapReduce任务来执行,从而实现对数据进行分析的目的。本书配套示例源码、PPT课件、教学大纲。本书可作为Hive数据仓库初学者的入门书,也可作为Hive大数据分析与大数据应用开发工程师的指导手册,还可作为高等院校或者高职高专计算机技术、人工智能、大数据技术及相关专业的教材或教学参考书。 《Hive入门与大数据分析实战》共分11章,内容包括数据仓库与Hive、Hive部署与基本操作、Hive语法基础、Hive数据定义、Hive数据操作、Hive查询、Hive函数、Hive数据压缩、Hive调优、基于Hive的网站流量分析项目实战、旅游酒店评价大数据分析项目实战。最后的两个项目实战(均包括SQL和Java编程两种解决方法)帮助读者提高Hive大数据分析的综合实战能力。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,也可以作为高等学校相关专业的本科生、研究生的教学用书。
编辑推荐
《Hive入门与大数据分析实战》本系统讲解数据仓库和Hive的基本概念、Hive部署过程、Hive语法基础、Hive数据定义、Hive数据操纵、Hive数据查询、Hive函数、Hive数据压缩、Hive调优,并通过网站流量分析大数据、旅游酒店评价大数据分析两个综合项目,帮助读者提升大数据分析的实战能力。 配套全书示例源码、PPT课件、作者答疑服务。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2023-06-01
- 更新: 2023-11-16
- 书号:9787302634218
- 中图:TP311.13
- 学科:工学控制科学与工程工学计算机科学与技术