Hive入门与大数据分析实战

作者: 迟殿委

出版社: 清华大学出版社

出版日期: 2023-06-01

电子书 ¥57.85 定价:89.0
  • 收藏

  • 加书架

  • 引用

简介

Hive是基于Hadoop的一个数据仓库工具,用来进行数据的提取、转换、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive能将结构化的数据文件映射为一张数据库表,并能提供SQL查询分析功能,将SQL语句转换成MapReduce任务来执行,从而实现对数据进行分析的目的。本书配套示例源码、PPT课件、教学大纲。本书可作为Hive数据仓库初学者的入门书,也可作为Hive大数据分析与大数据应用开发工程师的指导手册,还可作为高等院校或者高职高专计算机技术、人工智能、大数据技术及相关专业的教材或教学参考书。 《Hive入门与大数据分析实战》共分11章,内容包括数据仓库与Hive、Hive部署与基本操作、Hive语法基础、Hive数据定义、Hive数据操作、Hive查询、Hive函数、Hive数据压缩、Hive调优、基于Hive的网站流量分析项目实战、旅游酒店评价大数据分析项目实战。最后的两个项目实战(均包括SQL和Java编程两种解决方法)帮助读者提高Hive大数据分析的综合实战能力。 本书注重基础,内容翔实,突出示例讲解,既可以作为从事数据分析处理的科研工程技术人员的自学用书,也可以作为高等学校相关专业的本科生、研究生的教学用书。

编辑推荐

《Hive入门与大数据分析实战》本系统讲解数据仓库和Hive的基本概念、Hive部署过程、Hive语法基础、Hive数据定义、Hive数据操纵、Hive数据查询、Hive函数、Hive数据压缩、Hive调优,并通过网站流量分析大数据、旅游酒店评价大数据分析两个综合项目,帮助读者提升大数据分析的实战能力。 配套全书示例源码、PPT课件、作者答疑服务。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2023-06-01
  • 作者:迟殿委
  • 更新: 2023-11-16
  • 书号:9787302634218
  • 中图:TP311.13
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

作者信息

迟殿委

迟殿委,计算机软件与理论专业硕士,毕业于南昌大学,系统架构设计师。有多年企业软件研发经验和丰富的大数据技术培训经验,熟练掌握JavaEE全栈技术框架以及主流大数据技术框架,擅长JavaEE系统架构设计、大数据分析与挖掘。编写图书《Hadoop大数据分析技术》《Hadoop+Spark大数据分析实战》《Spring Boot企业级开发实战(视频教学版)》等。

相关图书