开源大数据分析引擎Impala实战

作者: 贾传青

出版社: 清华大学出版社

出版日期: 2015-03-01

电子书 ¥32.56 定价:59.0
  • 收藏

  • 加书架

  • 引用

简介

Impala是 Cloudera公司主导开发的新型查询系统,它提供 SQL语义,能查询存储在 Hadoop的 HDFS和 HBase中的 PB级大数据。Impala 1.0版比原来基于 MapReduce的 Hive SQL查询速度提升 3~90倍,因此, Impala有可能完全取代 Hive。作者基于自己在本职工作中应用 Impala的实践和心得编写了本书。本书共分 10章,全面介绍开源大数据分析引擎 Impala的技术背景、安装与配置、架构、操作方法、性能优化,以及最富技术含量的应用设计原则和应用案例。本书紧扣目前计算技术发展热点,适合所有大数据分析人员、大数据开发人员和大数据管理人员参考使用。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2015-03-01
  • 作者:贾传青
  • 更新: 2023-06-07
  • 书号:9787302390022
  • 中图:TP311.138
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术