文献基本信息
中文标题:抵抗语音转换伪造的扩散重构式主动防御方法
英文标题:Defeating Voice Conversion Forgery by Active Defense with Diffusion Reconstruction
基金项目:国家自然科学基金项目 (62572251, U22B2062)
作者单位:
南京信息工程大学数字取证教育部工程研究中心
南京
210044
摘 要:语音深度生成技术已经能够生成逼真的语音。其在丰富人们娱乐和生活的同时,也易被不法分子滥用进行语音伪造,从而对个人隐私与社会安全带来巨大隐患。作为语音伪造的主流防御手段,现有的主动防御技术虽然已取得了一定成效,但在防御能力与防御样本不可感知性的平衡以及鲁棒性上仍然一般。为此,本文提出了一种抵抗语音转换伪造的扩散重构式主动防御方法。该方法利用扩散声码器PriorGrad作为生成器,借助基于待保护语音的扩散先验指导逐步去噪过程,从而重构待保护语音直接得到防御语音样本。而且,该方法还设计了多尺度人耳感知损失,重点抑制人耳敏感频段的扰动幅度,进一步提升防御样本不可感知性。针对四个先进的语音转换模型的实验表明:本文方法在兼顾语音防御样本不可感知性的前提下,基于说话人验证精度客观评价指标,防御能力相比次优方法在白盒场景下平均提升约32%,在黑盒场景下平均提升约16%,实现了防御能力与样本不可感知性之间更好的平衡;而且,针对三种不同有损压缩和高斯滤波攻击,本文方法均取得了比现有方法更好的鲁棒性。