R语言(第2版)

作者: 刘鹏、 程显毅

出版社: 清华大学出版社

出版日期: 2022-07-01

电子书 ¥38.35 定价:59.0
  • 收藏

  • 加书架

  • 引用

简介

本书通过Titanic 数据分析案例,深入浅出地介绍了R 语言在大数据分析应用中的相关知识,包括: 数据准备、数据清洗、数据探索、数据变换、特征工程、数据建模、模型评估、模型部署等。全书共13 章,第1~3 章介绍R 语言的开发环境和基本语法;第4~8 章按数据分析生命周期讨论R语言的实现; 第9 章高级编程相对独立,主要解决复杂问题可能用到的程序结构;第10、11 章与机器学习有关,内容 偏难,但通过Rattle 包回避了算法底层技术的难点;第12、13 章通过两个实际项目,让读者体验数据处 理的全过程以及业务对分析的重要性。本书力求以简洁、精练、理论与实践相结合的方式,让读者快速掌 握R 语言。 本书既可作为数据分析相关课程的教材,也可作为数据分析爱好者的参考资料。

编辑推荐

本书深入浅出地介绍了 R 语言在大数据分析应用中的相关知识,全书 分为绪论(第1 章)、基础篇、应用篇和进阶篇。基础篇(第2~10 章) 学习如何用R 语言完成数据处理,包括数据准备、数据探索、数据变换、 数据可视化和数据建模等;应用篇(第11、12 章)学习如何用R 语言完成 实际的数据分析报告撰写,包括背景与目标、指标设计、描述性分析、模 型分析和结论与建议;进阶篇(第13、14 章)学习如何使用R 语言提高大 数据处理性能,包括RHadoop、SparkR。 本书特点如下。(1)知识学习的重点是模型的运用,而不是模型的原理。 (2)注重数据变成价值。(3)关注大数据分析。 (4)向读者提供了书中所用的配套代码、数据及PPT,读者可通过上机实验, 快速掌握书中所介绍的R 语言的使用方法。 第2 版对第1 版的内容和结构都做了较大的调整。 (1)去掉了数据分析师素养等宏观内容,而更加注重实操和解决实际问题。 (2)全书的实验数据以Titanic 项目为切入点,贯穿数据处理的全过程。从实际项目出发讲解相关知识点,因此增强了业务场景的体验。 (3)去掉了大数据处理的章节,因为大数据处理的方法、思维和小数据没有本质区别,只是平台不同。 (4)增加了字符串处理、特征工程、数据建模、模型评估方面的内容。 (5)增加了大量的学习资料:PPT、习题、代码、数据集、扩展阅读、微课视频等。 (6)增加了近几年R 语言的最新成果:pacman、caret、tidyverse、mlr 等。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2022-07-01
  • 作者:刘鹏、 程显毅
  • 更新: 2023-07-04
  • 书号:9787302610229
  • 中图:TP312R
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术