语音信号识别技术与实践

作者姜囡著
出版社东北大学出版社
出版时间 2019年12月第1版
ISBN 9787551723800
定价 58.00

内容简介

《语音信号识别技术与实践》内容分为8章。第1章为语音识别技术概述，介绍了语音识别技术的原理和发展与应用。第2章为语音信号处理基本技术，包括数字化预处理、短时时域处理和频域处理的内容。第3章是语音信号的端点检测和分割，介绍了端点检测的原理和常规检测方法，提出了基于复杂背景条件下的端点检测算法，包括算法流程和实验方法。第4章是语音分割聚类，研究了如何获取一段多人对话语音中说话人身份变动的信息，以及如何确定哪些语音段是由同一个人发出来的。详细介绍了三种方法，包括基于混合特征的分割聚类方法、基于改进双门限端点检测的分割法、基于自组织神经网络的改进K-means聚类算法。第5章为基于神经网络的语音识别，详述了基于自适应免疫克隆神经网络的语音识别算法原理、流程和实验方法。第6章是伪装语音识别，探讨了在语音被采用伪装手段（如在耳语、假声、模仿他人讲话、捏鼻子讲话以及用手绢或口罩等物品捂嘴讲话等）情况下，如何正确进行语音鉴定的问题。提出了基于GFCC与共振峰的声纹提取方法和基于深度置信网络模型的声纹提取方法。第7章是基于语音信号的心理压力分级与识别，探讨了反映心理压力的生理信号和分级实验方法，以及基于语音信号的心理压力识别方法。第8章是不同情感的语音声学特征分析，通过对生气、害怕、高兴、中性、惊讶、悲伤六种情感语音的共振峰频率特征、共振峰走向特征、音节间的过渡特征、音节内的过渡特征、基频曲线特征以及振幅曲线特征进行语音声学特征分析，探索了同一个人的语音在不同情感下表现的特征差异。《语音信号识别技术与实践》较全面地总结了课题组近年来关于语音识别、语音与心理压力等级识别、语音与情感分析方面的研究内容。主要章节均以理论介绍、算法流程、实验步骤、结果分析为脉络撰写，内容详尽，循序渐进，适合语音识别及语音情感分析的初学者，希望为在此领域有求知欲的学子打开一扇探索之门。

语音信号识别技术与实践

内容简介

目录