简介
本书阐述了数据流分类问题的基础理论、技术方法以及应用实践,为面向实际数据流开展分类数据挖掘任务提供了理论与实践基础。全书共分四篇12章。第一篇是引言篇,本篇首先简介数据挖掘的相关概念,然后介绍数据流挖掘的相关定义、应用背景及理论基础与技术,最后重点总结数据流分类挖掘的主要研究进展并归纳了存在的关键问题;第二篇是基础篇,本篇主要阐述了分类挖掘任务中常用的模型与技术,为后续数据流分类方法提供技术基础;第三篇是专题篇:本篇首先总结分析适宜于数据流环境的几种集成模型,并通过两个示例讲解了基于加权集成模型的数据流分类算法的应用。然后详细介绍若干数据流的概念漂移检测与分类方法、不完全标记数据流分类方法以及面向实际应用数据的特征选择方法,并通过在模拟与实际数据上的大量实验考察了这些方法的分类性能;第四篇是实验资源篇,本篇首先介绍数据流分类算法实验工具ETDSv1.0 的功能与用户使用说明,然后归纳总结目前流行的面向数据流环境的实验平台以及在数据流分类任务中常用的数据集。本书在数据流中概念漂移检测问题、不完全标记问题、特征选择等方面有许多独到见解,总结归纳了近年来在数据流分类任务上的研究成果,并归纳提炼了数据流分类研究任务中存在的重要开放性问题。本书可作为计算机软件与理论、计算机应用类的研究生教材,也可供对数据流挖掘等领域感兴趣的相关教师、本科生、研究生以及科技工作者参考。另外,本书介绍的相关实验软件平台已开源,可为从事数据流挖掘等方向的科研工作者提供实践与二次开发平台。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2015-12-01
- 更新: 2023-06-07
- 书号:9787302405993
- 中图:TP274
- 学科:工学控制科学与工程工学计算机科学与技术