基金项目:Laboratory of Target Cognition and Application Technology under Grant 2023-CXPT-LC-005, Science and Disruptive Technology Program under Grant AIRCAS2024-AIRCAS-SDTP-03, Key Program of Chinese Academy of Sciences uner Grant RCJJ-145-24-13 and KGFZD-145-25-38
作 者:罗一畅1, 2, 3, 4
齐析屿1, 2, 3, 4
张博锐5
师汉儒1, 2, 3, 4
赵妍1, 2, 3, 4
王磊1, 2, 3
刘世雄1, 2
摘 要:Meta公司提出的分割一切模型(Segment Anything Model, SAM)作为计算机视觉领域的基础模型,在图像分割、目标检测与跟踪等任务中展现出强大的零样本泛化能力。然而,SAM模型依赖计算密集型的图像编码器(如ViT-H)和复杂的任务解码架构,导致高昂的计算资源消耗和存储需求,严重限制了其在边缘设备、移动终端等资源受限场景中的实际部署。为提升SAM的实用性,近年来研究者提出了多种轻量化方法。该文系统性综述了相关进展:首先,从任务范式、模型架构、数据引擎和应用领域等多方面简要介绍了SAM的基本情况。其次,回顾了高效基础架构替换、知识蒸馏、模型量化和模型剪枝等模型压缩方法。在此基础上,进一步概述了重构模型结构和轻量化网络替代等方法在当前SAM轻量化研究中的具体应用情况。最后,聚焦效率和精度上的平衡问题,对SAM轻量化模型未来的发展方向进行了深入分析和讨论。