《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》 [法]丹尼斯·罗斯曼(Denis Rothman)著叶伟民译 9787302648727 【清华大学出版社官方正版电子书】- 文泉书局

基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理

作者： [法]丹尼斯·罗斯曼(Denis Rothman)著叶伟民译

出版社：清华大学出版社

出版日期： 2024-01-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥64.87 （ 定价：99.8 ）

支持送礼物

送给好友

收藏
加书架
引用

亮点

习题答案

简介

Transformer正在颠覆AI领域。市面上有这么平台和Transformer模型，哪些最符合你的需求？将引领你进入Transformer的世界，将讲述不同模型和平台的优势，指出如何消除模型的缺点和问题。本书将引导你使用Hugging Face从头开始预训练一个RoBERTa模型，包括构建数据集、定义数据整理器以及训练模型等。《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》分步展示如何微调GPT-3等预训练模型。研究机器翻译、语音转文本、文本转语音、问答等NLP任务，并介绍解决NLP难题的技术，甚至帮助你应对假新闻焦虑(详见第13章)。从书中可了解到，诸如OpenAI的高级平台将Transformer扩展到语言领域、计算机视觉领域，并允许使用DALL-E 2、ChatGPT和GPT-4生成代码。通过本书，你将了解到Transformer的工作原理以及如何实施Transformer来决NLP问题。主要内容 • 了解用于解决复杂语言问题的新技术 • 将GPT-3与T5、GPT-2和基于BERT的Transformer的结果进行对比 • 使用TensorFlow、PyTorch和GPT-3执行情感分析、文本摘要、非正式语言分析、机器翻译等任务 • 了解ViT和CLIP如何标注图像(包括模糊化)，并使用DALL-E从文本生成图像 • 学习ChatGPT和GPT-4的高级提示工程机制

编辑推荐

在不到4 年的时间里，Transformer 模型以其强大的性能和创新的思想，迅速在NLP 社区崭露头角，打破了过去30 年的记录。BERT、T5 和GPT 等模型现在已成为计算机视觉、语音识别、翻译、蛋白质测序、编码等各个领域中新应用的基础构件。因此，斯坦福大学最近提出了“基础模型”这个术语，用于定义基于巨型预训练Transformer 的一系列大型语言模型。所有这些进步都归功于一些简单的想法。《基于GPT-3、ChatGPT、GPT-4等Transformer架构的自然语言处理》可作为所有对Transformer 工作原理感兴趣的人的参考书。作者在理论和实践两方面都做出了出色的工作，详细解释了如何逐步使用Transformer。阅读完本书后，你将能使用这一最先进的技术集合来增强你的深度学习应用能力。本书在详细介绍BERT、RoBERTa、T5 和GPT-3 等流行模型前，先讲述了Transformer 的架构以便为你的学习奠定坚实基础。本书还讲述了如何将Transformer 应用于许多用例，如文本摘要、图像标注、问答、情感分析和假新闻分析等。如果你对这些主题感兴趣，那么本书绝对是值得一读的。 ——Antonio Gulli Google 工程总监Antonio Gulli

更多出版物信息

版权：清华大学出版社
出版： 2024-01-01
作者：[法]丹尼斯·罗斯曼(Denis Rothman)著叶伟民译
更新： 2024-10-24
书号：9787302648727
中图：TP391
学科：

工学

控制科学与工程
工学

计算机科学与技术

封面 1

扉页 2

版权页 3

专家推荐 4

作者简介 5

致谢 6

审校者简介 7

前言 8

目录 13

第1章 Transformer型介绍 20

第2章 Transformer模型架构入门 34

第3章微调BERT模型 62

第4章从头开始预训练RoBERTa模型 85

第5章使用Transformer处理下游NLP任务 104

第6章机器翻译 123

第7章 GPT-3 139

第8章文本摘要(以法律和财务文档为例) 163

第9章数据集预处理和词元分析器 180

第10章基于BERT的语义角色标注 202

第11章使用Transformer进行问答 221

第12章情绪分析 243

第13章使用Transformer分析假新闻 263

第14章可解释AI 283

第15章从NLP到计算机视觉 298

第16章 AI助理 319

第17章 ChatGPT和GPT-4 346

正文结束 372

附录A Transformer模型术语 373

附录B Transformer模型的硬件约束 375

附录C 使用GPT-2进行文本补全 381

附录D 使用自定义数据集训练GPT-2模型 390

附录E 练习题答案 399

参考资料 411

封底 420

作者信息

[法]丹尼斯·罗斯曼(Denis Rothman)著叶伟民译

Denis Rothman 毕业于法国巴黎索邦大学和狄德罗大学，设计了首批获得专利的编码和嵌入系统，编写了首批获得专利的AI 认知机器人和机器人。他的职业生涯始于为Moët et Chandon 提供NLP(自然语言处理)聊天机器人，并为空中客车公司(前身为Aerospatiale)提供AI 战术防御优化器。此后，Denis 为IBM 和奢侈品牌开发了AI资源优化器，并最终发展为在全球范围内使用的APS(高级规划和调度)解决方案。