基于小波变换的语音信息隐藏新方法-期刊天空网手机端

　　摘要：针对音频载体在隐藏机密信息时，存在隐藏容量小、隐蔽性不高和鲁棒性较差等不足，该文提出一种基于小波变换的音频信息隐藏新算法。该算法利用人耳听觉系统对语音信号的中高频信息微小变化不敏感的特性，调节语音段小波变换的中高频系数，进而改变每级小波变换高频系数前后两部分的能量状态来隐藏二进制机密信息。首先测试隐藏深度、隐藏频段和载体语音分段长度 3 个参数对载体语音质量和机密信息误码率的影响，选择算法所需的最佳参数，然后测试算法的可行性和各项评价指标，最后对算法进行常见的 5 种攻击测试。测试结果表明该算法能够实现机密信息的盲提取;具有良好的隐蔽性和鲁棒性，能够抵御加噪、低通滤波、重采样、重量化和回声干扰等多种攻击;具有较大的隐藏容量，且语音分段长度越短，隐藏容量越大。

基于小波变换的语音信息隐藏新方法

　　关键词：信息隐藏;小波变换;高频系数;能量状态

　　1 引言

　　信息隐藏技术是指将特定的信息嵌入到数字化的载体信息中，在隐藏信息内容的同时也隐蔽信息传播这一行为，以保证密文不引起监控者的注意从而减少被攻击的可能性[1]，其核心技术是信息隐藏与提取算法。与加密技术相比，信息隐藏技术是隐藏信息的存在性，让攻击者无法发现，因此信息隐藏更为安全[2,3]。信息隐藏技术常以语音、文字或图像等媒体类型作为宿主载体。由于图像媒体具有较大的冗余空间，人们常使用图像作为隐藏机密信息的载体，如文献[4]提出一种基于分块自适应压缩感知的可逆水印算法，文献[5]提出一种鲁棒可分离的密文域水印算法。语音是人们最常使用的信息传输方式，是通信系统和互联网传输中最主要的业务类型，因此研究基于语音的信息隐藏技术在保密通信、军事情报、版权标记和隐私保护等多个领域具有重要的研究意义和应用价值[6,7]。但是由于语音信号冗余信息较少，且语音传输信道较为复杂，因此国内外针对以语音信号为载体的信息隐藏方法研究还较少[8]。

　　随着移动通信系统和互联网语音通信的快速发展，近年来更多的国内外专家专注于语音信息隐藏方法的研究，出现了较多的理论和文献。文献[9]提出了一种基于振幅值修改的音频隐写算法，隐蔽性较好。文献[10]提出了一种基于多小波域的水印算法。文献[11]利用人耳对音频的采样倒置不敏感的特性，通过倒置小波系数正负极性隐藏机密信息。文献[12,13]提出基于离散余弦变换的语音信息隐藏方法。文献[14]提出基于奇异值分解的音频信息隐藏方法取得了较好的隐藏效果。通过对当前国内外音频信息隐藏方法分析发现，音频信息隐藏方法主要有空间域隐藏和变换域隐藏两大类[15]，其中变换域方法由于具有很好的透明性和鲁棒性获得了更多的应用[16]，但目前大多数变换域方法还存在一些不足，如算法复杂度高或仅在隐藏容量、隐蔽性和鲁棒性 3 项指标间获得某一项指标的突破，当 3 项指标要求发生变化时往往无法通过调整算法参数来兼顾三者平衡。

　　本文提出一种基于小波变换的语音信息隐藏的新方法，该方法首先对载体语音进行低通滤波，然后进行多级小波变换，利用人耳对中高频信息微小变化的不敏感，通过比较各级小波高频系数的能量来隐藏机密信息。首先测试在不同隐藏深度、不同隐藏频段和载体语音不同分段长度的情况下载体语音质量和机密信息误码率，选择算法所需的合适参数，然后测试算法的可行性和各项评价指标，最后对算法进行常见的 5 种攻击测试。实验结果显示该方法简单易行，可实现盲检测，具有较大的隐藏容量、良好的隐蔽性和较强的鲁棒性，能够抵御加噪、低通滤波、重采样、重量化和回声干扰等多种攻击。此外，在实际应用中可调整算法参数平衡隐藏容量、隐蔽性和鲁棒性 3 项指标要求。

　　2 信息隐藏与提取算法原理及参数选择

　　2.1 信息隐藏原理

　　人耳所能捕获到的语音信号频率主要分布在 300~3400 Hz 的频段范围内，低于 300 Hz 的低频信号和超出 3400 Hz 以上的高频信号人耳往往难以捕捉。利用人耳听觉系统对语音中高频能量的微小变化不敏感这一特点可以将机密信息隐藏到载体音频信号中。把语音信号按一定时长分段后，对每一段语音进行 r 级小波分解得到高频段、中高频段、中低频段和低频段等多个小波系数。把每一频段的小波系数分为前后两部分，按式(1)和式(2)计算前后两部分的能量，根据机密信息的二进制值按式(3)、式 (4)和式(5)调整各级小波系数，得到嵌入机密信息后的系数。

　　2.2 信息提取原理

　　提取机密信息时，首先对携密语音按相同的时长进行分段，然后对每一语音段进行 r 级小波分解，按式(1)和式(2)计算各段语音每一级高频段系数 ( ) ' H s k 前后两部分的能量 EQ' k 和 EH' k ( k = 1,2, ,  r )。最后按式(6)提取各级小波高频系数中嵌入的二进制机密信息。

　　2.4.1 信息隐藏频段选择语音信号经过 r 级小波分解后产生各个频段下的小波系数，修改任一级小波系数对语音质量都会产生不同程度的影响。

　　图1所示为经过3级小波(小波库为db1)分解后， 4个小波系数在不同嵌入深度lk 下分别嵌入信息后载体语音SNR曲线对比图(语音分段长度为20 ms)。图2所示为在不同嵌入深度lk 下，从4个小波系数上提取的机密信息的误码率曲线对比图(40 dB噪声攻击)。图1和图2显示，小波系数的频段越高，载体语音质量下降越少，机密信息隐蔽性越好，但提取的机密信息误码率也越大;频段很低的系数嵌入机密信息后载体语音质量受损严重，但其系数上提取的机密信息误码率几乎为零。可见，载体语音质量和机密信息提取误码率是一对矛盾，在最高频和最低频系数上隐藏信息都是不合适的，可选择在中高频和中低频两个系数上嵌入机密信息。

　　2.4.2 载体语音分段长度的选择把载体语音分为 10 ms, 20 ms, 30 ms 3 种不同长度的语音段，按 2.1 节所述方法在第 2 级高频系数上嵌入机密信息，测试语音分段长度对携密载体语音质量和机密信息误码率的影响。

　　图3 为不同语音分段长度下载体语音SNR 对比图。图 4 为不同语音分段长度下提取的机密信息 BER 对比图(由于在 40 dB 以上的噪声攻击下算法的误码率为零，因此图 4 结果是在 30 dB 噪声攻击下完成的)。图 3 和图 4 显示，语音分段长度越短，携密载体语音质量受损越小，提取机密信息的误码率越高。究其原因是因为语音分段长度越短，语音段前后两部分能量越小，按式(3)修改的高频系数变化越小，从而语音质量变化越小，但在白噪声攻击下提取机密信息的误码率越高。此外，语音分段长度越短，单位时间内嵌入的机密信息比特数越多，隐藏容量越大。

　　2.4.3 嵌入深度l 的选择图 1 和图 3 显示，在嵌入深度lk 值为 1 时载体语音的信噪比最高，随着lk 的逐渐增大，SNR 值变小，载体语音质量变差。图 2 和图 4 显示，随着lk 的逐渐增大，提取的机密信息误码率变小。

　　以上实验结果表明，载体语音 SNR、机密信息 BER 和算法隐藏容量是一组矛盾，在实际应用中，应根据具体指标要求选择合适的信息隐藏频段、嵌入深度和语音分段长度。

　　3 基于小波变换的信息隐藏算法的实现

　　由 2.4 节参数选择可见，选择不同的信息隐藏频段、载体语音分段长度和嵌入深度对携密语音的语音质量、提取的机密信息的误码率以及算法隐藏容量都有不同程度的影响。根据 2.4 节的实验结果，选择以下参数测试算法的各项性能：(1)在经过 3 级小波变换的中高频和中低频系数上隐藏机密信息; (2)中高频系数的隐藏深度 2 l = 2 ，中低频系数的隐藏深度 3 l = 1.5 ; (3)语音分段长度为 20 ms; (4)载体语音：采样频率 16 kHz，量化位数 16 bit; (5)机密语音：采样频率 8 kHz，量化精度 8 bit。

　　3.1 信息隐藏算法步骤

　　(1)机密信息经过加密和编码形成长度为L的二进制比特流 X xi i Lxi = << Ì { } ( ),0 , ( ) (0,1) ，将 X 分为奇偶两组，每组二进制串前各添加 2 组 8 bit 全 1 的信息嵌入开始标记，二进制串后各添加 2 组 8 bit 全 0 的信息嵌入结束标记;

　　(2)载体语音经过低通滤波(通带截止频率 7 kHz，阻带截止频率 7.8 kHz，通带衰减 3 dB，阻带衰减 40 dB)后被分为 20 ms 长度的语音段C = { ( ), c j 0 } < (5)按给定嵌入深度l2 和l3 ，根据式(3)、式(4) 式(5)将奇数组机密信息嵌入到 H2 系数中，偶数组机密信息嵌入到 H3系数中，获取嵌入后的高频系数 2 ' H 和 3 ' H ; (6)根据嵌入信息后的各级系数进行小波逆变换，重构载体语音C' 。

　　4 实验测试及结果分析

　　在无攻击情况下按3.1节和3.2节所述步骤进行实验测试。机密信息为一段时长 674 ms 的语音“南京”，载体语音为录制的涵盖中文男声、中文女声、英文男声和英文女声共 4 种类型的 20 条语音。

　　相关知识推荐：研究信息隐藏相关领域的论文文献

　　4.1 算法隐蔽性与隐藏容量分析

　　在 20 条载体语音上隐藏机密信息，每条语音做 10 次测试，总共进行 200 次测试。实验所得结果取均值列于表 1 中。其中 SNR1为载体语音的信噪比、 PESQ1为载体语音客观评分值，SNR2为提取的机密语音信噪比，PESQ2为载体语音客观评分值，BER 为提取的机密语音误码率，Cap 为算法隐藏容量。由于算法在每个长度为 20 ms 的语音段上隐藏 2 bit 机密信息，因此隐藏容量 Cap=2/20(bit/ms)=100 bit/s。表 1 结果显示，载体语音具有较高的信噪比，且 PESQ 值在 3.8 以上，人耳基本感觉不到载体语音的细微变化，因此算法具有良好的隐蔽性和较高的隐藏容量。此外，不同语种的载体语音对语音质量和误码率略有影响。

　　4.2 算法可行性测试与分析

　　图 5 为某段载体语音嵌入机密信息前后的波形对比图(截取部分波形)，由图 5 以及表 1 中载体语音的 SNR1和 PESQ1实验数据可见，载体语音波形图和语音质量未发生明显变化，说明算法具有较好的隐蔽性。图 6 为机密信息提取前后的波形对比图，由图 6 及表 1 中机密信息的 SNR2, PESQ2和 BER 实验数据可见，机密信息波形未发生明显变化，且提取的 BER 值非常小，即算法能够在保证载体语音质量的条件下隐藏机密信息。

　　4.3 算法鲁棒性测试与分析

　　信息隐藏算法的鲁棒性是评价算法性能的重要指标，把原始载体语音和携密载体语音同步进行以下常见的 5 种攻击测试，从被攻击后的原始语音信噪比 SNR、携密语音信噪比 SNR1、机密语音信噪比 SNR2、原始语音质量 PESQ、携密语音质量 PESQ1、机密语音质量 PESQ2以及提取的机密信息误码率 BER 等指标评价算法的鲁棒性，各项指标测试结果的平均值列入表 2。

　　(1)白噪声攻击：使用信噪比为 20 dB, 30 dB 和 40 dB 的白噪声进行攻击。

　　(2)低通滤波：两种语音经过通带截止频率为 6 kHz 的 Butterworth 低通滤波器处理。

　　(3)重采样：对两种语音进行上、下两种重采样攻击。上采样：采样率按 16-32-16(kHz)变化;下采样：采样率按 16-8-16(kHz)变化。

　　(4)重量化：对两种语音进行升位和降位两种重量化攻击。升位量化：携密载体语音的量化精度按 16-32-16(bit)变化;降位量化：携密载体语音的量化精度按 16-8-16(bit)变化。

　　(5)回声干扰：携密载体语音加入 10 ms 的回声干扰。

　　实验测试结果表明：

　　(1)本文算法对白噪声和低通滤波攻击具有较好的鲁棒性。在 40 dB 噪声攻击和低通滤波攻击下，携密载体语音具有较高的 SNR1值和 PESQ1值，提取的机密信息SNR2和PESQ2值较高，BER 值极小，听觉效果良好，与文献[10-12]相比具有更好的鲁棒性能。在 30 dB 和 20 dB 噪声攻击下，原始语音和携密语音质量都有下降，提取的机密信息 SNR2 降低，BER 值升高，说明较大的白噪声攻击对两种语音质量影响都很大，原始载体语音即使未隐藏有机密信息其语音质量也受损严重。可见，本文算法对抗白噪声和低通滤波这两种攻击具有较好的鲁棒性。

　　(2)本文算法对上采样和升量化攻击具有较好的鲁棒性，下采样和降量化攻击对算法鲁棒性有一定影响。采样改变的是语音采样点的位置，量化改变的是采样点的幅值。上采样和升量化后采样点位置和幅值基本无变化，所以载体语音质量非常好，提取的机密信息误码率较低。下采样和降量化后采样点数和采样幅值变化较大，两种载体语音的 SNR 和 PESQ 下降都较为明显，但其 PESQ 值仍在 3.5 左右，提取的机密信息 BER 值略逊于文献[10-12]。

　　(3)较小的回声干扰对本文算法鲁棒性基本无影响。回声干扰在 10 ms 左右时，本文算法性能非常好，说明延时较小的回声干扰对算法性能影响较小。

　　(4)本文算法的鲁棒性在白噪声、上采样、升量化、低通滤波和回声干扰 5 种攻击下比文献[10-12] 中所述算法优越。下采样和降量化攻击时鲁棒性稍逊于文献[10-12]中算法。 5 结论基于小波变换的信息隐藏算法根据机密信息的二进制状态调节载体语音的各级高频小波系数，从而改变语音段前后两部分的能量状态来隐藏信息，提取机密信息时通过对比语音段中前后两部分的能量大小识别机密信息，无需原始载体语音，能实现机密信息的盲提取。针对具体的应用背景，可通过调节隐藏频段、嵌入深度和语音分段长度 3 项参数平衡算法性能指标。实验及分析结果表明，该算法具有较好的隐蔽性和鲁棒性，能够对抗白噪声、低通滤波、重采用、升量化和回声干扰等多种攻击，在保证载体语音质量的条件下每一语音段内可实现 2 bit 的信息隐藏，且语音分段长度越小，小波分解级数越多，则隐藏容量越大。——论文作者：吴秋玲*①② 吴蒙①

您身边的学术顾问

基于小波变换的语音信息隐藏新方法