DeepSeek大模型高性能核心技术与多模态融合开发

作者: 王晓华

出版社: 清华大学出版社

出版日期: 2025-03-01

电子书 暂不销售 定价:119.0
  • 收藏

  • 加书架

  • 引用

简介

本书从高性能注意力机制和多模态融合技术入手,使用国产之光DeepSeek多模态大模型,详细讲解注意力机制及其变种(包括Self-Attention、MHA、Autoregressive、MoE、MQA、GQA、GLA、DifferentialAttention)的基本原理和应用实践,以及多模态融合策略、技术与应用案例。本书配套示例源码、PPT课件与读者微信技术交流群。全书共分15章,内容包括高性能注意力与多模态融合概述、PyTorch深度学习环境搭建、注意力机制详解之基础篇、注意力机制详解之进阶篇、注意力机制详解之高级篇、注意力机制详解之调优篇、DeepSeekAPI实战迪士尼游玩攻略、DeepSeek实战广告文案撰写与微调、Diffusion可控图像生成实战、多模态图文理解与问答实战、交叉注意力语音转换实战、多模态特征Token压缩实战、图像编码器详解与图形重建实战、端到端视频分类实战、基于DeepSeek的跨平台智能客服开发实战。本书采用理论与实践相结合的方式,包含大量代码示例和实战案例,适合注意力机制初学者、多模态融合开发人员阅读。本书也适合作为高等院校或高职高专院校人工智能大模型方向的教材。

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2025-03-01
  • 作者:王晓华
  • 更新: 2025-05-19
  • 书号:9787302684893
  • 中图:TP18
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术

作者信息

王晓华

相关图书