-
收藏
-
加书架
-
引用
本书在不涉及大量数学模型与复杂编程知识的前提下,从零开始逐步带领读者熟悉并掌握当下流行的基于Python 3的数据分析,以及支持单机、深度和分布式机器学习的开源程序库,如pandas、Scikitlearn、PyTorch、TensorFlow、PaddlePaddle、PySparkML等。全书分4部分。入门篇包括对全书核心概念的指南性介绍,以及在多种主流操作系统(Windows、macOS、Ubuntu)上配置基本编程环境的详细说明。基础篇涵盖Python 3的编程基础、基于pandas的数据分析,以及使用Scikitlearn解决大量经典的单机(单核/多核)机器学习问题。进阶篇介绍如何使用PyTorch、TensorFlow、PaddlePaddle搭建多种深度学习网络框架,以及如何基于PySpark的ML编程库完成一些常见的分布式机器学习任务。实践篇利用全书所讲授的Python编程、数据分析、机器学习知识,帮助读者挑战和参与Kaggle多种类型的竞赛实战,同时介绍如何使用Git在Gitee、GitHub平台上维护和管理日常代码与编程项目。 本书适合所有对人工智能领域,特别是机器学习、数据挖掘、自然语言处理等技术及其实践感兴趣的初学者。
该书帮助大量对机器学习、数据挖掘感兴趣的读者朋友整合时下最流行的基于Python语言的程序库:如Scikit-learn,NLTK,XGBoost,TensorFlow等,并且针对现实中遇到的数据,甚至是Kaggle竞赛(时下世界最流行的机器学习竞赛平台)中的分析任务,快速搭建有效的机器学习系统。 同时,作者力求减少读者为了理解本书,而对编程技能、数学背景的过分依赖;进而降低机器学习模型的实践门槛,让更多的兴趣爱好者体会到使用经典模型以及最新的高效方法解决实际问题的乐趣。同时,笔者对每一个关键术语都提供了标准的英文表述,也方便读者朋友更加快速查阅、理解相关的英文文献。
- 版权: 清华大学出版社
- 出版: 2022-10-01
- 更新: 2023-11-24
- 书号:9787302614241
- 中图:TP181-43;TP311.56-43
- 学科:工学控制科学与工程工学计算机科学与技术工学软件工程