《大语言模型开发：用开源模型开发本地系统》范煜 9787302670513 【清华大学出版社官方正版电子书】- 文泉书局

大语言模型开发：用开源模型开发本地系统

作者：范煜

出版社：清华大学出版社

出版日期： 2024-09-01

优惠券：
￥3
￥10
￥30
￥70
领券

电子书：￥76.7 （ 定价：118.0 ）

支持送礼物

送给好友

收藏
加书架
引用

简介

本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程，以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从Python Numpy实现单层感知机和神经网络开始，逐步讲解了如何实现Transformer模型和Llama模型。此外，本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入，书中重点介绍了监督微调，也介绍了RAG中词向量的计算。本书采用循序渐进的方式，通过功能框图、代码分解执行、执行结果显示、背景知识补充等手段帮助读者理解模型和算法。本书的核心读者群体定位为大语言模型应用的开发人员，特别适合那些想从计算机视觉转向自然语言处理的人。此外，本书还适合作为大学本科生及研究生相关课程的参考教材使用。

编辑推荐

•本书基本覆盖大语言模型开发的多个方面。整体上可以参照OpenAI的安德烈•卡帕西（Andrej Karpathy）在微软的2023年Build大会报告中介绍的GPT助手训练流程。 •本书的内容来源不仅包含网络上的各类教程和文章，也包括原始论文和源代码。 •本书不但适用于大型语言模型应用开发人员，而且对于渴望深度探究ChatGPT背后的运行机制，更高效地运用和优化其功能的实践者，同样具有极高的参考价值。

更多出版物信息

版权：清华大学出版社
出版： 2024-09-01
作者：范煜
更新： 2024-11-13
书号：9787302670513
中图：TP391
学科：

工学

控制科学与工程
工学

计算机科学与技术

封面 1

扉页 2

版权页 3

前言 4

目录 7

第1章自然语言处理 13

第2章深度学习基础 28

第3章 PyTorch开发基础 57

第4章 Transformer模型详解 87

第5章大语言模型 136

第6章模型训练 157

第7章模型微调 193

第8章人类反馈强化学习 207

第9章模型推理 244

第10章中文私有模型开发 286

第11章模型评估 303

第12章用于RAG的词向量计算 317

正文结束 331

参考文献 332

封底 333

作者信息

范煜

范煜，江苏南通人，毕业于南京航空航天大学，研究员级高级工程师，中国商业联合会数据分析专业委员会专家组成员，南通理工学院教师，上海范思软件有限公司创始人，中国移动集团、51CTO外聘讲师经常在全国各地讲授大数据、数据分析人工智能、大语言模型等方面课程。研发了Fancy Q&A大语言模型应用开发平台。著有《人工智能与ChatGPT》《数据革命:大数据价值实现方法、技术与案例》。兼具人工智能、大数据、软件、工业控制(嵌入式系统和软PLC)技术背景。目前主要从事基于大语言模型的知识库建设与知识问答应用的研究和开发。

大语言模型开发：用开源模型开发本地系统

作者信息

范煜

推荐专题

正义的算法：司法变革与未来法治

数字时代的艺术生产：工具、AI与跨媒介实践

数字经济浪潮：洞察、变革与前沿

碳路新篇：战略、路径与创新

“移” 路探索：移动智能新纪元

驭见智行：自动驾驶全景洞察

相关图书

ChatGLM3大模型本地化部署、应用开发与微调

ChatGLM3大模型本地化部署、应用开发与微调

大模型Agent应用开发

大模型Agent应用开发

LangChain大模型应用开发

LangChain大模型应用开发

大模型RAG应用开发：构建智能生成系统

大模型RAG应用开发：构建智能生成系统

大模型智能推荐系统：技术解析与开发实践

大模型智能推荐系统：技术解析与开发实践

LangChain大模型AI应用开发实践

LangChain大模型AI应用开发实践

金融大模型开发与应用实践

金融大模型开发与应用实践

大模型定制开发--行业应用与解决方案

大模型定制开发--行业应用与解决方案

快速部署大模型：LLM策略与实践（基于ChatGPT等大语言模型）

快速部署大模型：LLM策略与实践（基于ChatGPT等大语言模型）

相关课程

R语言临床预测模型实战（9787302621119/093720-01）

深度探索Go语言——对象模型与runtime的原理、特性及应用（9787302600855/091440-01）

HuggingFace自然语言处理详解——基于BERT中文模型的任务实战（9787302628538/098824-01）

鸿蒙操作系统应用开发实践（9787302582014/092233-01）

鸿蒙操作系统开发入门经典（9787302582007/091752-01）

Dart语言实战：基于Flutter框架的程序开发（9787302582199/090620-01）

Xilinx FPGA应用开发

Linux开发书系——吴光科

Web应用开发技术（高屹）

细说PyTorch深度学习：理论、算法、模型与编程实现(9787302631941/101495-01)