文献基本信息
中文标题:隐私保护的联邦弱监督组织病理学亚型分类方法
英文标题:Privacy-Preserving Federated Weakly-Supervised Learning for Cancer Subtyping on Histopathology Images
基金项目:国家自然科学基金(82272075, U22A20345),广东省科技计划项目(2022B1212010011)
作 者:王钰萌1, 2, 3
刘振丙1
刘再毅2, 3, 1
作者单位:1. 桂林电子科技大学计算机与信息安全学院 桂林 541004
2. 南方医科大学附属广东省人民医院/广东省医学科学院放射科 广州 510080
3. 广东省医学影像智能分析与应用重点实验室 广州 510080
摘 要:数据驱动的深度学习方法已展现出优越性能,但其成功实施往往依赖于大量细粒度标注训练数据。此外,医疗数据通常呈“数据孤岛”状态,复杂的数据共享过程可能会存在患者隐私泄露的风险。联邦学习 (FL)能够使多个医疗中心在不共享数据的情况下协同训练一个深度学习模型。然而,在计算病理学领域,源自不同医疗中心的病理图像之间普遍存在数据异质性。这些固有的数据异质性可能会显著影响模型性能。针对以上问题,该研究提出一种适用于计算病理学领域千兆像素全切片图像 (WSI)的隐私保护FL方法,该方法结合弱监督的注意力多实例学习 (MIL)与差分隐私技术。具体而言,对于各个参与客户端,使用一种弱监督的多尺度注意力MIL方法,仅需要切片级标签监督本地模型训练,以应对千兆像素病理WSI标注成本高昂的问题。在联邦权重聚合阶段,引入本地化差分隐私技术,进一步降低敏感数据泄露风险;同时采用一种新的联邦自适应重加权策略,旨在克服客户端之间病理图像异质性所带来的挑战。在两种癌症组织学分型任务上评估了所提出FL方法的有效性。实验结果表明,在保障患者数据隐私的前提下,该研究所提出的FL方法相较于本地化模型及其它FL方法,表现出更高的分类准确率;即便与中心化模型相比,其分类性能仍然具备一定竞争力。