王晓华
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch 2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。本书配套示例源代码、PPT课件。 《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch 2.0深度学习环境搭建、从零开始学习PyTorch 2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。 《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
梅磊、施海平、陈靖
ChatGPT作为人工智能领域的一大进步,引起了热议,其强大功能的背后离不开大模型的支持。大模型指的是参数规模超过千万的机器学习模型,主要应用于语音识别、计算机视觉等领域。 本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。其次,本书从数据服务、智能搜索、办公工具、对话式AI、休闲娱乐、生产制造、智慧营销、智慧城市等方面讲述了大模型的诸多应用场景,并阐述了大模型在这些领域的应用现状、应用潜力、企业探索实践等。 本书内容丰富,理论与实践案例结合,能够为对大模型感兴趣的企业管理者、创业者、投资者等深入研究大模型提供指导。
蔡越
本书以ChatGPT为科技行业带来的颠覆性革新为起点,深入探讨了人工智能大模型如何为我们的创作提供强大支持。本书旨在帮助创作者更好地理解AI的价值,并充分利用其能力提升写作效率和质量。本书共7章,全面阐述了ChatGPT如何帮助创作者突破写作瓶颈、建立稳固的创作基础,并掌握高效成稿能力。此外,书中还详细介绍了在各类创意写作和职场写作领域中,如何利用ChatGPT进行高效创作。同时,本书还深入探讨了提示词在创作过程中所发挥的关键节点效应,以及ChatGPT如何帮助创作者塑造个人品牌价值,进而提升个人在职场中的发展空间。本书以通俗易懂的语言和丰富的案例,为致力于提高写作效率的创作者、追求结构化表达的商业人士等群体提供了实用的指导。此外,本书还可以作为相关培训课程的教材使用,帮助读者更好地掌握人工智能大模型在写作中的应用。
刘丙润
运用好?AI工具,借此我们就可以轻松写出高质量文章,做出高质量视频,甚至直播也可以借此轻松变现。在本书中,笔者重点讲解了13款人工智能应用在新媒体变现中的技巧和方法。本书共分为8章,分别讲解了常见的人工智能以及人工智能影响下的广告流量变现、商业合作变现、直播变现、私域变现和IP变现等。此外,本书还对未来的人工智能与新媒体变现做了趋势分析。本书适合写作、视频、直播类新媒体从业人员以及相关培训机构参考使用。
颜少林
本书聚焦大模型,对大模型的技术场景和商业应用展开详细叙述。本书主要从典型应用ChatGPT入手,探寻其背后支撑大模型的魅力。首先,本书对大模型的基础概念、产业格局、带来的新型商业模式进行讲解,展现了大模型的发展现状和商业化潜力。其次,本书从数据服务、智能搜索、办公工具、对话式AI、休闲娱乐、生产制造、智慧营销、智慧城市等方面讲述了大模型的诸多应用场景,并阐述了大模型在这些领域的应用现状、应用潜力、企业探索实践等。 本书内容丰富,理论与实践案例结合,能够为对大模型感兴趣的企业管理者、创业者、投资者等深入研究大模型提供指导。
王晓华
本书作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,专注于大模型的本地化部署、应用开发以及微调等领域。本书不仅系统地阐述了深度学习大模型的核心理论,更注重实践应用,通过丰富的案例和场景,引导读者从理论走向实践,真正领悟和掌握大模型本地化应用的精髓。全书共分13章,全方位、多角度地展示了大模型本地化实战的完整方案,内容包括大模型时代的开端、PyTorch 2.0 深度学习环境搭建、基于gradio的云上自托管ChatGLM3部署实战、使用ChatGLM3与LangChain实现知识图谱抽取和智能问答、适配ChatGLM3终端的Prompt与Chain详解、ChatGLM3多文本检索的增强生成实战、构建ChatGLM3规范化提示工程、使用ChatGLM3的思维链构建、GLM源码分析与文本生成实战、低资源单GPU微调ChatGLM3实战、会使用工具的ChatGLM3、上市公司财报非结构化信息抽取实战、上市公司财报智能问答与财务预警实战。本书适合大模型的初学者、有一定基础的大模型研究人员、大模型应用开发人员。同时,本书还可作为高等院校或高职高专相关专业的大模型课程教材,助力培养新一代的大模型领域人才。
刘丙润
掌握人工智能辅助文案写作的方式,就可以轻松写出高质量文案,进而实现文案变现。本书通过对10款人工智能的介绍及调试,帮助读者快速掌握人工智能辅助文案变现的方式。本书共10章,分别讲解AI智能创作的发展,AI智能创作工具,AI智能辅助泛流量文案、商业文案、泛私域文案的创作模式,人工智能辅助文案变现的底层逻辑,以及在今日头条、百家号、小红书、知乎等平台及不同展示形式下进行文案创作的实战案例等内容。本书适合希望通过文案写作实现变现的写作新人、写作爱好者以及相关培训机构使用。
段小手
本书以通俗易懂的语言和有趣的插画来解释深度学习中的概念和方法, 生动形象的插图更容易帮助读者理解和记忆。 同时, 书中指导读者将自己的理解制作成短视频, 以加强学习效果。 另外, 书中还指导读者在 Kaggle 平台上进行实践。本书内容全面, 从基础的神经网络、 卷积神经网络、 循环神经网络等入门知识, 到深度学习的应用领域如计算机视觉、 自然语言处理等高级主题都有涉及。本书具有丰富的趣味性、 互动性和实践性, 可以帮助读者更好地理解深度学习知识, 并为未来的职业发展打下坚实的基础。
郑楠、李耀东、戴汝为
综合集成研讨体系源于系统科学和复杂性科学的研究,是我国科学家钱学森院士、戴汝为院士(本书作者之一)等学者在整合系统、思维、智能等学科理论的基础上,于20世纪90年代初提出的处理“开放的复杂巨系统”的方法论。当前,随着社会、网络以及AI自身的高速发展,综合集成研讨体系的应用环境和对象均发生了一定的变化,如何吸收信息科学、认知科学、智能科学的前沿研究成果,纳入更加广泛的智能主体,设计更为通用的群体智能增强框架、过程和方法,促进更大范围内群体智慧的涌现,来共同处理更加复杂的重大决策问题和科技创新问题,是综合集成研讨体系发展的必然要求。为此,本书回顾了系统科学与复杂性科学的发展历程,从混合智能的角度重新梳理综合集成方法论的前期经验,进一步探究综合集成研讨体系的智能理论基础,开展了体系智能的融合与演化、社会智能的激发和使用等问题研究。这些工作不仅面向认知智能的前沿课题,更能为开放复杂环境下异构化、层次化认知智能和体系智能的研究开辟了一条新路,为其它类型的混合智能研究者提供了基础理论工具,同时将继续促进中国原创性综合集成方法论的有效、深入、持续发展和应用。
徐华,王洪燕,袁源
以大规模深度学习模型超参调优为代表的评估代价昂贵的多目标优化问题被称为昂贵的多目标优化问题(Expensive MOPs)。昂贵的多目标优化问题广泛存在于现实世界中的不同应用领域。其优化目标通常为黑盒函数,且求得其真实目标函数值的评估代价高昂;而现实世界的有限资源和成本只允许求解器进行有限次函数评估,用于搜索该类问题的帕累托前沿。多目标贝叶斯优化方法能有效地求解该类问题,其利用高斯过程代理模型近似原优化问题以降低函数评估成本,并使用能平衡利用和探索之间关系的获取函数推荐候选解。本书关注大模型超参调优这类昂贵的多目标优化问题,针对其经典的求解方法(贝叶斯优化方法)开展理论方法探索。针对低维和高维决策空间中的并行化函数评估问题、获取函数优化效率问题以及维度灾难和边界问题,本书对多目标贝叶斯优化方法进行四方面的研究,旨在有效地求解低维和高维昂贵的多目标优化问题。 本书可作为当前大模型超参调优理论研究与应用实践的指导书,也可作为演化学习、智能优化、大数据及人工智能等相关专业的教材和参考书。
王国平
《动手学PyTorch建模与应用:从深度学习到大模型》是一本从零基础上手深度学习和大模型的PyTorch实战指南。《动手学PyTorch建模与应用:从深度学习到大模型》共11章,第1章主要介绍深度学习的概念、应用场景及开发环境搭建。第2章详细介绍PyTorch数学基础,包括函数、微分、数理统计、矩阵等基础知识及其案例。第3章介绍数据预处理及常用工具,包括NumPy、Pandas、Matplotlib、数据清洗、特征工程以及深度学习解决问题的一般步骤等。第4章介绍PyTorch基础知识,包括张量的创建、激活函数、损失函数、优化器等。第5章介绍PyTorch深度神经网络,包括神经网络概述、卷积神经网络、循环神经网络等。第6章介绍PyTorch数据建模,包括回归分析、聚类分析、主成分分析、模型评估与调优等。第7~10章介绍PyTorch图像建模、文本建模、音频建模和模型可视化。第11章介绍大语言模型的原理、主要的大语言模型及模型本地化部署、预训练与微调技术。本书还精心设计了50个动手案例和上机练习题,并对所有代码进行了详尽注释和说明,同时提供数据集和配书资源文件,以帮助读者更好地使用本书。 《动手学PyTorch建模与应用:从深度学习到大模型》讲解深入浅出,注重动手实操,特别适合想学习AI技术或想进入该领域的初学者,对深度学习感兴趣的新手、在校学生和从业者阅读,也很适合作为培训机构和高校相关专业的教学用书。
崔皓
本书是一本旨在帮助读者深入理解和应用AIGC与大模型技术的实用指南。写作目的是为了让读者了解AIGC与大模型技术的发展趋势、核心驱动力、定义与关键特征,以及如何利用大模型的能力进行实际应用。书籍分多个部分,包括AIGC与大模型技术概览、入门大模型开发、娱乐产业应用、多媒体行业应用、金融业应用、大数据分析应用、企业知识库应用和电商平台应用。其中,亮点案例包括娱乐产业的角色扮演应用、多媒体行业的音视频处理创新、金融业的股票分析以及电商平台的智能购物体验等。这些案例展示了AIGC与大模型技术在不同领域的实际应用,以及如何通过技术拓展应用思维和巩固程序设计思维。本书适合对AIGC与大模型技术感兴趣的读者,特别是大模型从业人事、程序员、产品经理、项目经理等。通过阅读本书,读者可以了解AIGC与大模型技术的基本概念和应用场景,掌握实际应用技巧,并拓展应用思维。此外,本书也可作为相关领域的专业教材或参考书,为读者提供深入的技术知识和实用的案例参考。
张爱玲、杨占略
本书致力于探索如何在大规模深度学习模型训练中,最大限度地提高性能和优化显存使用。本书面向深度学习从业者,尤其是希望深入了解并提升模型训练效率的工程师与研究人员。随着深度学习模型和数据规模的迅速增长,如何高效利用硬件资源,减少训练时间,成为当前AI系统工程的关键挑战。本书从硬件和软件的基础知识入手,逐步引导读者理解和掌握PyTorch的优化技巧。内容涵盖从单机到分布式训练,从显存管理到性能分析的多种优化策略,力求通过丰富的代码实例和深入的原理讲解,使读者能够在实践中灵活应用这些方法。 本书共分10章:第1~4章为基础知识,介绍深度学习所需的硬件与软件基础,帮助读者理解性能瓶颈的根源;第5~8章为优化策略,结合具体的代码示例,详细探讨训练过程中的各种优化方法及其背后的原理;第9和10章为综合实践,通对GPT模型的优化实例,直观展示如何在实际项目中实施并衡量各种优化技术的效果。 本书适合希望优化现有模型的资深工程师,也适合初次接触PyTorch性能优化的新手,本书将提供实用的指导和技术支持,帮助读者在日益复杂的深度学习领域中保持竞争力。
张治政
本书循序渐进、深入讲解了金融大模型开发与应用实战的核心知识,并通过具体实例的实现过程演练了各个知识点的用法。全书共11章,分别讲解了大模型基础、数据预处理与特征工程、金融时间序列分析、金融风险建模与管理、高频交易与量化交易、资产定价与交易策略优化、金融市场情绪分析、区块链与金融科技创新、基于深度强化学习的量化交易系统(OpenAIBaselines+FinRL+DRL+PyPortfolioOpt)、基于趋势跟踪的期货交易系统(TechnicalAnalysislibrary+yfinance+Quantstats)、上市公司估值系统(OpenAI+LangChain+Tableau+PowerBI)。本书易于阅读,以极简的文字介绍了复杂的案例,同时涵盖了其他同类图书中很少涉及的历史参考资料,是学习金融大模型开发的完美教程。本书适用于已经了解了Python基础开发的读者,想进一步学习大模型开发、模型优化、模型应用和模型架构的读者,也可以作为证券、保险、银行等从业者的参考书,还可以作为大专院校相关专业的师生用书和培训机构的专业性教材。
李永华、刘宇沛、孙玉江
大模型技术是目前人工智能领域的重要发展方向之一,具有广阔的应用前景和巨大的发展潜力。本 书结合当前高等院校创新实践课程,基于大模型应用程序的开发方法,给出可执行实战案例。大模型技术 主要开发方向为人机聊天、自动生成代码、旅游图鉴等,本书案例主要包括系统架构、系统流程、开发环境、 开发工具、系统实现、功能测试等内容。 本书中所述案例多样化,可满足不同层次的人员需求; 同时,本书附赠视频讲解、工程文件、拓展知识、 插图素材、程序代码,供读者自我学习和自我提高使用。 本书可作为大学信息与通信工程及相关专业的本科生教材,也可作为从事物联网、创新开发和设计的 专业技术人员的参考用书。
[英] 本·奥法斯(Ben Auffarth) 著 郭涛 译
OpenAI的ChatGPT和GPT模型给我们思考世界的方式带来了一场革命——不仅是在我们如何写作和研究方面,还在我们如何处理信息方面。本书讨论了包括ChatGPT和Bard在内的大语言模型的功能、能力和局限性。它还演示了如何使用LangChain框架来实现基于这些模型的生产就绪应用程序,例如代理和个人助理,以及如何与其他工具(例如web搜索和代码执行)集成。在学习中,你将使用transformer模型和不同的注意力机制,完善训练和微调的复杂过程。您将掌握使用pandas和Python进行自动分析和可视化的数据驱动决策。您还将深入了解如何使用这些模型、提示、培训和微调以及大规模部署的启发式方法。当你读完这本书的时候,你会对大语言模型的作用有一个深刻的理解,以及如何充分利用它们。
更多精彩专题