空天荟~电子科学与技术

基于视觉语言模型的SAR图像目标解译综述

DOI：10.12000/JR25256 CSTR：

文献基本信息

中文标题：基于视觉语言模型的SAR图像目标解译综述

英文标题：SAR Image Target Interpretation Based on Vision-Language Model: A Survey

来源期刊：雷达学报

基金项目：国家自然科学基金联合基金重点项目(U24B20189)

作者：王君宇, 孙浩, 黄启灏, 计科峰, 匡纲要

作者单位：国防科技大学电子科学学院电子信息系统复杂电磁环境效应国家重点实验室长沙 410073

摘要：合成孔径雷达(SAR)在军事和民用领域应用广泛，SAR图像目标智能解译是SAR应用的重要组成部分。视觉语言模型在SAR目标解译过程中发挥了关键作用，通过引入自然语言理解有效弥补了SAR目标特性差异大和高质量标注样本稀缺的挑战，实现了从纯视觉解译到目标语义理解的发展。该文结合团队在SAR目标解译理论、算法及应用等方面的长期研究积累，对基于视觉语言的SAR图像目标智能解译进行了全面回顾和综述，深入分析了现有挑战和任务并总结了研究现状，汇总整理了公开数据集，系统梳理了从特定任务的视觉语言模型到对比式、对话式和生成式视觉语言模型和基础模型的发展历程，最后探讨了该领域的最新挑战与展望。

全文链接： https://radars.ac.cn/cn/article/doi/10.12000/JR25256