书目

武汉大学优秀博士学位论文文库:基于双耳线索的移动音频编码研究

内容简介

飞速发展的移动市场对高品质音频业务的需求日益迫切,移动环境下音频带宽不足,终端资源有限,传统音频理论和技术面临新的挑战。近年来,MPEG、ITU和AVS等国内外标准化组织积极推动移动音频理论和技术研究。基于双耳线索的音频编码因其在低码率下的音质优势而备受关注,然而,为适应移动环境苛刻的应用需求,仍需克服空间参数模型的理论缺陷,突破实变换域双耳线索表示的技术瓶颈,解决空间参数码率难以下降、系统复杂度偏高等问题。陈水仙编著的这本《基于双耳线索的移动音频编码研究》开展基于双耳线索的移动音频编码研究,在双耳线索感知机理分析、空间感知信息度量、MDCT域双耳线索表示和空间音频编码系统结构设计这四个方向上取得了创新性成果。在双耳线索感知机理分析方向,《武汉大学优秀博士学位论文文库:基于双耳线索的移动音频编码研究》针对现有系统只能去除声道间数据客观冗余的不足,以巴克频带为感知分析单元,开展了对双耳线索临界感知JND的分析研究,提出基于感知的双耳线索参数表示模型,有效去除了声道问数据的主观冗余信息,下降4.28%~11.78%的空间参数码率,主观测试MUSHRA得分平均提高2.6分,客观测试ODG得分平均提高1.1分。在空间感知信息度量方向,本书针对建立在单耳听音模型上的感知熵理论无法度量双耳空间感知信息量的问题,结合双耳线索的感知机理,建立了基于双耳线索生理感知的BCPPM模型来模拟双耳对空间信息的感知过程,提出基于模型的空间感知熵SPE的计算方法,解决了双耳空间感知信息量的度量问题,丰富和发展了空间音频编码技术的理论和实践。在MDCT域双耳线索表示方向,本书针对MDCT实变换的相位信息缺失及能量抖动造成双耳线索表示不准确的问题,采用基函数“和分离”技术,提出了基于共轭窗函数的MDCT频谱复数化扩展方法,并针对新方法引入MDST带来复杂度增加的问题,提出了基于转换矩阵稀疏性的MDCT-MDST快速转换算法,同时利用转换矩阵的正交性和循环性,将复杂度从O(N*2)下降到O(N),主观测试MUSHRA得分平均提高2.07分,客观ODG得分平均提高0.4281分。在空间音频编码系统结构设计方向,本书针对空间信息和下混信息分离处理模式导致的系统复杂度高和延时长的问题,采用滤波复用和并行处理的技术,提出并行滤波共享的分析综合ABS编码结构,去除了空间参数编码与下混声道编码中的冗余操作,缩短了5%的系统延时,减少了38%~86%的运算复杂度。本书在基础理论和关键技术方面的研究成果可望成为国内移动音频标准的支撑技术,增强我国在高速成长的全球移动音频产业中的核心竞争力,为全面参与移动音频编解码领域的国际竞争和标准化工作奠定坚实的研究基础。

作者简介

陈水仙,女,2011年毕业于武汉大学计算机学院计算机应用技术专业,获博士学位。论文获湖北省优秀博士学位论文奖。现在中国科学院信息工程研究所工作。

目录

丛书

武汉大学优秀博士学位论文文库

—  END  —