能够模仿人类语言智能与思维,具有世界一般性知识的ChatGPT,开启了人类迈向通用人工智能的窗口,正成为引爆第四次工业革命的火种。本书是第一本体系化介绍ChatGPT基本原理与核心算法的教材及专业书籍。全书共分五章:第一章为深度神经网络基础;第二章详细剖析了Transformer及其缘起,分析了视觉领域的Transformer方法;第三章综述了各种大型语言模型框架,开启了GPT系列的思想之旅;第四章重点介绍了GPT的预训练方法与微调算法,系统阐述了强化学习基础与RLHF;第五章为ChatGPT的应用,包括上下文提示与思维链提示,并讨论了智能涌现。本书体系严谨,系统性强,不仅逻辑严密,内容丰富,而且深入浅出,图文并茂,特色鲜明,具有引领性、前瞻性和思想启迪性。本书可作为高等院校人工智能、智能科学与技术、计算机科学与技术、大数据、自动驾驶、新一代机器人及相关专业高年级本科生与研究生教材,同时可供上述专业的研究人员,算法工程师以及从事AI产品研发、产业发展与决策咨询等的工程技术人员、投资者、战略研究者和广大科技工作者参考。
u 各种大型语言模型及其相关基础方法、实现工具等,从文本单模态、视听觉多模态、具身智能到交互式智能体,几乎都可以完全使用深度神经网络进行系统阐述。这充分表明,自2012年AlexNet问世以来,各种基于端到端数据驱动的深度神经网络学习方法,已走了多远,不仅将自然语言处理、计算机视觉、语音处理等领域,进行了彻底改变,而且还正在让这些学科之间的边界消融,并迈向统一。 u 本书从深度神经网络的角度切入,体系化地介绍了ChatGPT的基本原理与核心算法,既包括了深度神经网络的基础知识与大演化脉络,Transformer兴起的缘由,也涉及ChatGPT等大型语言模型的预训练、微调、安全及价值对齐以及思维链提示应用等重点内容的介绍。 u 作者对深度卷积神经网络、LSTM、Transformer和强化学习方法进行了深入细致的剖析,其中对视觉Transformer相关基础大模型和GPT思想之旅的介绍,特色鲜明。 u 通用人工智能将给人类带来辉煌的未来。推动、掌握并有能力充分利用更多大型语言模型与通用人工智能相关基础知识的人,必将在这个快速发展与进化的世界中,获得更加强大的竞争力。
- 版权: 清华大学出版社
- 出版: 2025-03-01
- 更新: 2025-05-29
- 书号:9787302682639
- 中图:TP18
- 学科:工学控制科学与工程工学计算机科学与技术交叉学科智能科学与技术