书目

语音信号识别技术与实践

内容简介

《语音信号识别技术与实践》内容分为8章。第1章为语音识别技术概述,介绍了语音识别技术的原理和发展与应用。第2章为语音信号处理基本技术,包括数字化预处理、短时时域处理和频域处理的内容。第3章是语音信号的端点检测和分割,介绍了端点检测的原理和常规检测方法,提出了基于复杂背景条件下的端点检测算法,包括算法流程和实验方法。第4章是语音分割聚类,研究了如何获取一段多人对话语音中说话人身份变动的信息,以及如何确定哪些语音段是由同一个人发出来的。详细介绍了三种方法,包括基于混合特征的分割聚类方法、基于改进双门限端点检测的分割法、基于自组织神经网络的改进K-means聚类算法。第5章为基于神经网络的语音识别,详述了基于自适应免疫克隆神经网络的语音识别算法原理、流程和实验方法。第6章是伪装语音识别,探讨了在语音被采用伪装手段(如在耳语、假声、模仿他人讲话、捏鼻子讲话以及用手绢或口罩等物品捂嘴讲话等)情况下,如何正确进行语音鉴定的问题。提出了基于GFCC与共振峰的声纹提取方法和基于深度置信网络模型的声纹提取方法。第7章是基于语音信号的心理压力分级与识别,探讨了反映心理压力的生理信号和分级实验方法,以及基于语音信号的心理压力识别方法。第8章是不同情感的语音声学特征分析,通过对生气、害怕、高兴、中性、惊讶、悲伤六种情感语音的共振峰频率特征、共振峰走向特征、音节间的过渡特征、音节内的过渡特征、基频曲线特征以及振幅曲线特征进行语音声学特征分析,探索了同一个人的语音在不同情感下表现的特征差异。《语音信号识别技术与实践》较全面地总结了课题组近年来关于语音识别、语音与心理压力等级识别、语音与情感分析方面的研究内容。主要章节均以理论介绍、算法流程、实验步骤、结果分析为脉络撰写,内容详尽,循序渐进,适合语音识别及语音情感分析的初学者,希望为在此领域有求知欲的学子打开一扇探索之门。

目录

—  END  —