R语言数据高效处理指南

作者: 黄天元

出版社: 北京大学出版社

出版日期: 2019-09-01

电子书 ¥47.2 定价:59.0
  • 收藏

  • 加书架

  • 引用

简介

本书以R语言为基础,介绍做任何分析都绕不开的数据处理基本操作。从基本包入手,循序渐进地引导读者一步一步进行学习。首先介绍tidyverse生态系统的dplyr包,并在其后引入难度稍高但是性能更加优秀的data.table包,然后介绍支持分布式数据处理的sparklyr包。在本书的zui后部分还提供了实战的案例,并介绍了一些非常实用的数据处理技巧。 本书分为四个部分:di yi部分介绍基本的概念,介绍数据处理的基本概念和R语言编程基础,让零基础的读者也能迅速入门;第二部分是快速入门部分,介绍如何使用base-r基本包和tidyverse生态系统来解决基本的数据处理问题,让读者能够快速上手;第三部分是高级进阶内容,对于追求数据处理的速度和规模的用户而言,需要进阶学习data.table和sparklyr两个R包,从而获得更高的效率;第四部分是实战案例,利用航班数据进行演练,并对前面所学的技巧进行测试,而且分享了在R中进行数据处理的实用技巧。 本书不仅是需要用R语言进行数据分析的读者快速入门的教程,而且是数据分析人员常备的案头参考工具书,具备强大的索引查询功能。

编辑推荐

(1)循序渐进式教学:本书由基础数据处理(base-r)—简洁高效数据处理(tidyverse生态系统)—高速数据处理(data.table)—分布式数据处理(sparklyr),从基础到进阶操作,一应俱全。 (2)引导式教学:本书由浅入深,分层次讲解,每个知识点都配有可实现的代码辅助理解。 (3)案例式教学:本书实战应用部分涵盖数据搜集、数据处理、网络爬虫、文本挖掘、数据可视化、机器学习等多个领域,代码可直接用于实际工作和生活中。

更多出版物信息
  • 版权: 北京大学出版社
  • 出版: 2019-09-01
  • 作者:黄天元
  • 更新: 2023-03-22
  • 书号:9787301306086
  • 中图:TP274-62;TP312R-62
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术