空天荟~电子科学与技术

一种伪造注意图驱动的多任务深伪视频检测模型

DOI：10.11999/JEIT250926 CSTR：

文献基本信息

中文标题：一种伪造注意图驱动的多任务深伪视频检测模型

英文标题：A Fake Attention Map-Driven Multi-Task Deepfake Video Detection Model

来源期刊：电子与信息学报

基金项目：

作者：刘鹏宇^{1, 2} 郑添阳^{1, 2} 董敏^{1, 2}

作者单位：1. 北京工业大学信息科学技术学院北京 100124
2. 先进信息网络北京实验室北京 100124

摘要：目前高质量深度伪造视频检测方法大多基于隐式注意力机制的监督二分类模型。虽然该类模型能够通过自学习，判别伪造痕迹，鉴别异常区域，但在面对未经学习的伪造技术时，对伪造区域的敏感性降低，泛化性不足。基于此，本文提出一种伪造注意图驱动的多任务深伪视频检测模型(F-BiFPN-MTLNet)。首先，设计了一种融合伪造注意图的新型加权双向特征金字塔网络(F-BiFPN)，通过伪造注意图监督低层和高层特征图的融合过程，在减少信息冗余的同时，增强模型对高质量伪造区域的敏感性。然后，定义了一种基于显式注意力机制的多任务学习网络(MTLNet)。一方面，该网络在原有基于监督二分类器的单任务模型的基础上，结合基于可学习掩码的注意策略与增强自一致性的注意策略，实现多任务加权判别，提高模型检测的可靠性；另一方面，引入显式注意力机制，通过生成的伪造位置标签对特征图进行监督，显式的指导模型聚焦于容易产生伪影的敏感区域，提高模型的泛化能力。实验结果表明，本文构建的F-BiFPN-MTLNet模型在多个基准测试中均表现出了较好性能，在曲线下面积(AUC)和平均精度(AP)等指标上取得了显著的提升。

全文链接： https://jeit.ac.cn/cn/article/doi/10.11999/JEIT250926