简介
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概念时是,同样介绍聚类常用算法,如K均值算法、层次聚类法、密度聚类法等,作为有文本分类、文本聚类的应用,最后给出了信息抽取、社会网络中的实体关系抽取和事件抽取。
编辑推荐
本书系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,通俗易懂,实用性强。适合于做教材。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2021-02-01
- 更新: 2023-06-22
- 书号:9787302557869
- 中图:TP274;TP311.561
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程