语音识别：原理与应用（第2版）

作者洪青阳
出版社电子工业出版社
出版时间 2023年1月第2版
ISBN 9787121446337
定价 138.00

内容简介

本书系统地介绍了语音识别的原理与应用。全书共15章，原理部分涵盖声学特征、隐马尔可夫模型（HMM）、高斯混合模型（GMM）、深度神经网络（DNN）、语言模型和加权有限状态转换器（WFST），重点描述了GMM-HMM、DNN-HMM和端到端（E2E）三种语音识别框架；应用部分包含Kaldi、ESPnet、WeNet和工业应用实践介绍，内容主要来自工程经验，极具实用性。本书可以作为普通高等学校人工智能、计算机科学与技术、电子信息工程、自动化等专业的本科生及研究生的教材，也适合作为从事智能语音系统的科研人员和工程技术人员的参考书。

作者简介

洪青阳，厦门大学副教授，天聪智能创始人，主要研究方向是语音识别、声纹识别，先后主持国家自然科学基金两三项，科技部创新基金两项。牵头组建厦门大学智能语音实验室，带领xmuspeechXMUSPEECH团队连续两届获东方语种识别（OLR）竞赛第一名，成功研发国内第一套闽南语合成系统。具有丰富的工业界研发经验，与华为、云从、掌数科技、鼎桥等知名企业合作，承担过大量的智能语音项目，核心技术应用到华为智能手机和全国十五几个省市的司法/社保/证券/电力系统。长期从事本科生、研究生的语音识别教学工作，从最早的动态时间规整（DTW）、隐马尔可夫模型（HMM）到最新的端到端（E2E）语音识别框架，与时俱进更新教学内容，积累了丰富的教学经验。李琳，厦门大学副教授，博士生导师，主要研究方向为语音信号处理、声纹识别、智能系统设计，主持国家自然科学基金一项，负责国家科技部重点研发计划项目子课题一项、省级科研项目一项，作为第一合作者参与国家自然基金两项，曾获福建省科技进步奖二等奖、福建省教学成果奖二等奖、厦门市科技进步奖一等奖。参与指导XMUSPEECHxmuspeech团队连续两届获东方语种识别竞赛第一名。国际IEEE学会会员，CCF高级会员，NCMMSC常设机构委员会委员，CCF语音对话与听觉专业组委员会委员，NCMMSC常设机构委员会委员。

语音识别：原理与应用（第2版）

内容简介

作者简介

目录