ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。ElasticsearchHadoop作为一个完美的工具,用来连接Elasticsearch和Hadoop的生态系统。通过Kibana技术,ElasticsearchHadoop很容易从Hadoop生态系统中获得大数据分析的结果。 本书全面介绍ElasticsearchHadoop技术用于大数据分析以及数据可视化的方法。内容共分7章,包括Hadoop、Elasticsearch、Marvel和Kibana安装;通过编写MapReduce作业,把Hadoop数据导入Elasticsearch;全面分析Elasticsearch本质,如全文本搜索分析、查询、筛选器和聚合;使用Kibana创建各种可视化和交互式仪表板,并使用Storm和Elasticsearch分类现实世界的流数据以及相关的其他主题。 本书适合从事大数据分析人员、大数据应用开发的人员参考,也适合高等院校及培训机构相关专业的师生教学参考。
通过本书,你可以使用Elasticsearch、Kibana和Elasticsearch-Hadoop对流式数据或者HDFS上的数据进行高效的数据分析。 你将深入理解Hadoop、Elasticsearch、Marvel和Kibana的安装部署 ; 通过真实的案例你将了解到如何通过MapReduce作业将HDFS上的数据导入到Elasticsearch中。然后,你将全面理解像全文搜索、查询、过滤器、聚集等Elasticsearch中关键的概念 ; 了解如何使用Kibana进行可视化,创建交互报表 ; 学习如何使用Storm和Elasticsearch对真实案例中的数据进行分类和趋势分析。最后,学习如何将Elasticsearch与Pig、Hive、Spark等Hadoop生态系统进行集成。
- 版权: 清华大学出版社
- 出版: 2017-06-01
- 更新: 2023-10-13
- 书号:9787302469674
- 中图:G254.928
- 学科:教育学管理学信息资源管理文学新闻传播学