空天荟~电子科学与技术

抵抗语音转换伪造的扩散重构式主动防御方法

DOI：10.11999/JEIT250709 CSTR：

文献基本信息

中文标题：抵抗语音转换伪造的扩散重构式主动防御方法

英文标题：Defeating Voice Conversion Forgery by Active Defense with Diffusion Reconstruction

来源期刊：电子与信息学报

基金项目：国家自然科学基金项目 (62572251, U22B2062)

作者：田浩原陈宇轩陈北京付章杰

作者单位：南京信息工程大学数字取证教育部工程研究中心南京 210044

摘要：语音深度生成技术已经能够生成逼真的语音。其在丰富人们娱乐和生活的同时，也易被不法分子滥用进行语音伪造，从而对个人隐私与社会安全带来巨大隐患。作为语音伪造的主流防御手段，现有的主动防御技术虽然已取得了一定成效，但在防御能力与防御样本不可感知性的平衡以及鲁棒性上仍然一般。为此，本文提出了一种抵抗语音转换伪造的扩散重构式主动防御方法。该方法利用扩散声码器PriorGrad作为生成器，借助基于待保护语音的扩散先验指导逐步去噪过程，从而重构待保护语音直接得到防御语音样本。而且，该方法还设计了多尺度人耳感知损失，重点抑制人耳敏感频段的扰动幅度，进一步提升防御样本不可感知性。针对四个先进的语音转换模型的实验表明：本文方法在兼顾语音防御样本不可感知性的前提下，基于说话人验证精度客观评价指标，防御能力相比次优方法在白盒场景下平均提升约32%，在黑盒场景下平均提升约16%，实现了防御能力与样本不可感知性之间更好的平衡；而且，针对三种不同有损压缩和高斯滤波攻击，本文方法均取得了比现有方法更好的鲁棒性。

全文链接： https://jeit.ac.cn/cn/article/doi/10.11999/JEIT250709