PyTorch语音识别实战

作者: 王晓华

出版社: 清华大学出版社

出版日期: 2024-03-01

电子书 ¥44.85 定价:69.0
  • 收藏

  • 加书架

  • 引用

简介

《PyTorch语音识别实战》使用PyTorch 2.0作为语音识别的基本框架,循序渐进地引导读者从搭建环境开始,逐步深入到语音识别基本理论、算法以及应用实践,是较好的一本语音识别技术图书。本书配套示例源码、数据集、PPT课件等资源。 《PyTorch语音识别实战》分为13章,内容包括语音识别之路、PyTorch 2.0深度学习环境搭建、音频信号处理的理论与Python实战、音频处理常用工具包Librosa详解与实战、基于DNN的语音情绪分类识别、一学就会的深度学习基础算法、基于PyTorch卷积层的语音情绪分类识别、词映射与循环神经网络、基于Whisper的语音转换实战、注意力机制与注意力模型详解、鸟叫的多标签分类实战、多模态语音转换模型基础、GLM架构多模态语音文字转换实战。 《PyTorch语音识别实战》内容详尽、示例丰富,适合作为语音识别初学者、深度学习初学者、语音识别技术人员的必备参考书,同时也非常适合作为高等院校或高职高专深度学习、语音识别等课程的教材。

编辑推荐

众多实战案例,带你快速掌握语音识别应用开发 基于特征词的语音唤醒实战 短时傅里叶变换实战 梅尔频率倒谱系数实战 基于音频特征的声音聚类实战 基于深度神经网络的语音情绪识别实战 基于卷积神经网络的语音情绪识别实战 基于循环神经网络的文本内容情感分类实战 基于Whisper的语音转换实战 拼音汉字转化实战 鸟叫的多标签分类实战 多模态语音文字转换实战

更多出版物信息
  • 版权: 清华大学出版社
  • 出版: 2024-03-01
  • 作者:王晓华
  • 更新: 2024-05-31
  • 书号:9787302655657
  • 中图:TP18
  • 学科:
    工学
    控制科学与工程
    工学
    计算机科学与技术
    交叉学科
    智能科学与技术

作者信息

王晓华

王晓华,高校计算机专业讲师,研究方向为云计算、大数据与人工智能。其创作的部分图书:《从零开始大模型开发与微调:基于PyTorch与ChatGLM》《PyTorch 2.0深度学习从零开始学》《Python机器学习与可视化分析实战》《谷歌JAX深度学习从零开始学》《Spark 3.0大数据分析与挖掘:基于机器学习》《TensorFlow深度学习应用实践》《TensorFlow语音识别实战》《TensorFlow 2.0深度学习从零开始学》《深度学习的数学原理与实现》。

相关图书