-
收藏
-
加书架
-
引用
本书循序渐进地介绍R语言在数据分析与挖掘中的应用,涵盖数据分析与挖掘的常规流程,如数据预处理(清洗、整合与运算等)、数据可视化(离散型与连续型数据的绘图姿势)、数据建模(十大数据挖掘模型的应用)等内容。本书共分15章:第1章介绍R语言的基础知识,对于R语言初学者具有非常大的帮助;第2~4章讲解R语言的数据读写操作和数据的清洗与整理(如缺失值、异常值的处理,数据的聚合汇总计算,正则表达式等);第5~6章重点阐述R语言中的绘图神器ggplot2,详细介绍绘图模板和图形的处理细节;第9~15章讲解十大常用数据挖掘模型,如回归模型、树模型、集成模型等。通过本书的学习,读者既可以掌握R语言的实操技巧,也可以掌握数据分析与挖掘的理论和应用。 本书既适于统计学、数学、经济学、金融学、管理学以及相关理工科专业的本科生、研究生使用,也有助于提高从事数据咨询、研究和分析等工作人士的专业水平和技能。
本书一共分为三大部分,系统地介绍数据分析与挖掘过程中所涉及的数据清洗、整理、可视化以及建模等环节,具体内容如下: 第一部分(第1~4章)介绍R语言的一些基础知识和使用技巧,内容包含R语言中的数据结构、控制流语句和自定义函数、apply簇函数的使用、外部数据的读取、数据的清洗和整理以及正则表达式的使用。 第二部分(第5、6章)重点介绍绘图包ggplot2的使用,详细讲解各种统计图形的绘制方法(如条形图、环形图、瓦片图、直方图、小提琴图、折线图、面积图、散点图、地图等),以及图形绘制过程中的微调策略(如图例位置的摆放、自定义颜色的调整、图形形状的选择以及多图形的组合等)。 第三部分(第7~15章)一共包含了10种数据挖掘算法的应用,如线性回归、决策树、支持向量机、GBDT等。采用通俗易懂的手法介绍每一个挖掘算法的理论知识,并借助于具体的项目数据完成算法的实战。本部分内容既可以提高数据分析与挖掘的水平和技能,也可以作为数据挖掘算法实操的模板。
- 版权: 清华大学出版社
- 出版: 2021-01-01
- 更新: 2023-06-22
- 书号:9787302567622
- 中图:TP312R
- 学科:工学控制科学与工程工学计算机科学与技术