大数据离线分析

作者: 傅德谦、赵向兵、张林涛、刘鸣涛

出版社: 清华大学出版社

出版日期: 2017-08-01

电子书 ¥22.75 定价:35.0
支持送礼物
送给好友
  • 收藏

  • 加书架

  • 引用

简介

本书基于开源Hadoop大数据生态圈的主流离线分析工具Hive和Pig,通过技术讲解和案例实战相结合的方式,介绍了海量数据离线分析的技术方法。本书内容主要包括Hive数据库表、基于HiveQL的常规操作、视图、索引和Pig等数据处理分析和基础工具知识,Hive函数、Pig Latin编程、ETL工具Sqoop和工作流引擎Oozie等相关高级技术,以及实际项目案例。本书既可供学习大数据离线分析技术的本科和高职高专学生作为教材,也可供从事数据分析相关工作的技术人员作为参考资料。

编辑推荐

大数据离线处理目前技术上已经成熟。Hadoop框架是主流技术,使用HDFS存储数据,使用MapReduce做批量计算;需要数据仓库的存入Hive,然后从Hive进行分析和展现;涉及复杂业务场景时,使用Sqoop、Pig、Oozie等工具会更灵活方便。本书综合了大数据离线分析所需的主流技术,并配以案例和丰富的辅助学习资源,足以满足广大学习者入门的需要。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2017-08-01
  • 作者:傅德谦、赵向兵、张林涛、刘鸣涛
  • 更新: 2023-06-07
  • 书号:9787302483298
  • 中图:TP274-43
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术

相关图书