简介
进入互联网时代后,网络舆情形成迅速,影响着社会生活的方方面面,如何高效全面地采集舆情数据并利用数据挖掘算法及数据分析工具将舆情文本中有价值的信息挖掘出来,对于舆情监管、舆情研判、舆情引导至关重要。本书以R语言作为舆情分析的工具,在阐述相关原理的基础上,介绍了网络舆情信息采集、舆情信息预处理、舆情文本分类、舆情文本聚类、舆情数据关联规则挖掘、舆情相关指标预测等舆情分析环节,所有分析都使用R语言进行实现,给出了完整的过程和代码。本书可以作为舆情处理、数据分析等教学或科研的技术参考书,适于本科生、研究生、数据分析爱好者、舆情分析工作者及研究人员等阅读参考。
编辑推荐
作为数据分析的利器,与其它流行的统计分析软件(如Excel、Matlab、SAS、SPSS等)相比,R语言的优势主要体现在:开源免费、易于扩展、数据包丰富、可视化功能强大、可运行于多种平台。 本书力求简明扼要、提供干货,以*浅显的语言、详尽的R语言实现代码向读者循序渐进地展现网络舆情分析的完整过程。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2018-01-01
- 更新: 2024-12-03
- 书号:9787302482574
- 中图:TP312
- 学科:工学控制科学与工程工学计算机科学与技术