简介
本书全面系统地阐述了DeepSeek大模型的核心原理与实际应用,从理论到实践,为读者提供了一个完整的技术路径。全书共分为三部分10章,系统介绍大模型的理论、技术实现与行业应用。第1~4章聚焦于大模型的理论基础与核心技术,全面介绍了深度学习与大模型的演进、Transformer与MoE机制,深入解析了DeepSeek架构的关键设计思想与优化策略,帮助读者建立对大模型技术的全面理解。第5~7章转向实际应用开发,详细讲解了编程智能助手的技术实现、智能代码生成与调试以及Prompt设计等关键技术,为读者提供了如何将大模型应用于开发工具链的实践指导。第8~10章则聚焦于大模型在行业中的定制化应用,探索了数据构建、自监督学习、模型优化与部署等技术,结合具体行业案例,深入讨论了大模型如何在零售、制造等领域实现智能化应用,最终帮助读者掌握从需求分析到模型部署的全流程。本书结合大模型的理论与实践,从技术架构到实际开发,再到行业应用,全面覆盖了大模型的关键技术与应用场景。内容既适合人工智能、机器学习领域的技术人员,也适合高校师生和希望深入掌握大模型开发的读者。
更多出版物信息
- 版权: 清华大学出版社
- 出版: 2025-04-01
- 更新: 2025-05-29
- 书号:9787302685999
- 中图:TP18
- 学科:工学控制科学与工程工学计算机科学与技术交叉学科智能科学与技术