1、竞赛目的与意义
合成孔径雷达(SAR)图像因其独特的成像机制,能够在无光照或恶劣天气条件下获取地表高质量图像,是军事侦察、人道主义救援、地球观测等关键领域不可或缺的观测工具。在当前国际环境日趋复杂和动荡的背景下,提高SAR图像中目标检测的准确性和效率,对于提升我们的应急响应能力、加强国防安全和推动环境监测等方面具有重要意义。而SAR图像的图像特点决定了它不能像光学图像一样通过人眼就可对其进行直观解译,SAR图像的判读往往需要依靠专家的经验知识,难度高,解译效率低下。随着人工智能技术的迅速发展,尤其是深度学习在图像处理领域的广泛应用,如何准确快速地从复杂背景中检测出多类别目标成为了研究的热点。本次竞赛提供了首个COCO量级的SAR目标检测数据集,旨在吸引全球研究人员和技术爱好者的广泛参与,促进学术界和工业界在SAR图像处理领域的交流和合作,推动SAR图像处理技术的发展,提高SAR图像目标检测的自动化水平和准确性,从而加速人工智能技术在军事、人道主义救援和地球观测等关键领域的应用和实际落地。
2、竞赛组织方
组织方:南开大学计算机学院 (李翔、侯淇彬、李宇轩、程明明); 国防科技大学电子科学学院 (刘永祥、刘丽、刘振、刘天鹏、龚政辉、李玮杰、彭渤文、周洁);CSIG机器视觉专委会
合作方:深势科技
联系方式:yuxuan.li.17@ucl.ac.uk,xiang.li.implus@nankai.edu.cn, houqb@nankai.edu.cn
竞赛网站:https://bohrium.dp.tech/competitions/6816082019?tab=introduce
3、竞赛参与者要求
本次竞赛面向全球开放,欢迎国内外各大高校、研究机构、企业及个人技术爱好者组队参赛。
4、参赛方式
每个参赛队伍人员不超过5人,每名参赛选手只能参加1个参赛队,通过比赛官网(https://bohrium.dp.tech/competitions/6816082019?tab=introduce)注册报名。
5、组织方式
05月01日-08月15日:比赛官网参赛报名(请于北京时间8月15日23:59 之前完成组队,此截止日期之后队伍成员无法变更)。
05月15日-08月15日:数据集开放(以网盘形式提供下载,下载链接于官网公示,请在数据开放时间内尽快完成数据下载,同时比赛官网的计算资源优惠券开放)。
06月01日-08月31日:A榜开放,每队每天限提交2次。A榜成绩不计入总分。
09月01日-09月03日:B榜开放,每队一共只有2次提交机会,若提交2次,则以第二次提交为准。B榜成绩将计入总分。各参赛队需要提交代码及模型,截止时间为09月03日23时59分;结果应以规定格式保存,通过官网提交。
09月03日-09月24日:B榜封榜,进入代码与模型审核阶段。组委会根据B榜测试数据集,对用户提交的模型进行复现与评测,评比各队名次。
09月25日:公布审核后的最终B榜成绩。B榜前6名队伍进入决赛答辩环节。
10月18日-20日:研讨会召开,开展线下答辩,颁发奖状奖品。
如报名、组队、数据下载和结果提交等环节遇到问题,请及时与组织方联系。
6、赛事数据集的使用
a. 竞赛数据:
竞赛中将提供大规模合成孔径雷达多类别目标检测(SARDet[1]),包含超过116K张行人样本图片,共6类目标,分别为船,飞机,车辆,桥梁,港口和油罐。下表中列出了数据集的一些基本信息:
图片数 | 实例数 | 分辨率 | 波段 | 极化 | 卫星 | |
训练集 | 94,493 | 198,747 | 0.1m~25m | C, X, Ka, Ku | HH,VV, VH,HV, VV/VH VV/HH | Gaofen-3, Sentinal-1, TerraSAR-X, RadarSet-2等 |
验证集 | 10,492 | 22,703 | ||||
A榜测试集 | 613 | |||||
B榜测试集 | 11,613 |
数据集样本示例:
b. 硬件资源
深势科技将为每支队伍免费提供100元GPU云计算抵扣券,使用入口:https://bohrium.dp.tech/home;
B榜结束之后的代码验证环节,赛方将使用1台8卡3090 GPU 服务器负责对参赛团队最终提交的算法模型进行验证与测试。
服务器配置:
¡ CPU: 8 x Intel(R) Xeon(R) Platinum 8358 CPU @ 2.60GHz
¡ GPU: 8 x RTX3090 (24GB)
¡ 内存: 512GB
¡ 操作系统: Ubuntu 18.04.6 LTS
c. 使用方法
竞赛数据集将在官网供参赛团队下载使用,其中包含真实值标注的训练集与验证集用于算法模型训练与参数调试。测试数据集图像分为A榜和B榜,根据赛程逐一公开。测试集真实标注不公开。竞赛数据集仅供本竞赛使用,不得用于商业产品开发使用,未经许可不得转发他人使用。除了比赛提供的数据集,参赛队伍能且仅能使用ImageNet[2]、 COCO[3] 和 DOTA-v1.0[4] 数据集作为预训练或者数据增广辅助。为维护竞赛的公平性和竞赛目标的纯粹性,严禁使用其他数据集。
7、任务设置
参赛队伍需要使用赛方提供的训练和验证数据集,开发出能够准确检测SAR图像中多类别目标的算法。算法需要对SAR图像中的目标进行检测,输出每个目标的类别,置信度和位置(使用水平边界框表示)。
技术要求:参赛队可以使用开源的算法框架如Pytorch,mmdetection等。赛方推荐使用JDet检测框架进行算法开发https://cg.cs.tsinghua.edu.cn/jittor/assets/docs/JDet.html。JDet是基于Jittor[4]专门为目标检测任务设计的一套工具和库,能够帮助参赛队伍更高效地开发高性能的检测模型。官方对使用JDet进行开发的队伍,答辩环节分数有加成。
8、性能评价方法
A榜不计入总分仅用于迭代参考,B榜使用机器评测分。
本次竞赛机器评测分采用目标检测中普遍使用的 COCO mean Average Precision(mAP)[3] 作为评价指标。
经代码审核后的B榜前6名队伍进入线下决赛答辩环节。决赛每支队伍准备PPT进行8分钟答辩(包括6分钟陈述和2分钟提问)。评委将根据选手的技术思路、方法创新、理论深度和现场表现进行综合评分,总分100分。用JDet进行开发的队伍,答辩分数+10分。
最终成绩的计算方式为:70%客观评分+30%主观评分。这里客观评分指的是通过标准化处理后的B榜机器评测得分,而主观评分则是答辩分数经过标准化处理后的得分。标准化处理的方式是将最高分设定为100分,其余各分数按照比例进行调整。
若发现有队伍存在违规作弊行为,取消决赛资格,最终排名依照综合性能指标顺延。
违规作弊行为包括但不限于:
l 违规/恶意组队,消极比赛
l 无法提供代码进行测试及复现、或不配合进行代码测试及复现
l 模型代码与文档描述不符
l 模型代码与答辩时描述不符
l 使用除比赛提允许外的其他公开或非公开数据集
l 自行人工标注比赛测试集或人为修改模型输出并提交
l 其它存在违反本次比赛规则和公平性的行为
9、比赛任务的提交格式
提交内容:
A榜:提交A榜测试集的目标检测结果,以json文件形式于官网上提交。
B榜:提交B榜测试集的目标检测结果,以json文件形式于官网上提交。
其json文件包含以下示范格式的检测结果:
[
{
'ori_shape': (512, 512), # image size (height, width)
'img_name': '000001.png', # test image name
'pred_instances':
{'labels': [2,3], # predicted category ids
'bboxes': [[43.4, 27.1, 60.8, 63.3], [18.4, 49.2, 25.8, 45.8]], # predicted bonding boxes: [[top_left_point_x, top_left_point_y, bottom_right_point_x, bottom_right _point_y],…]
'scores': [0.9996, 0.9993] # prediction confidences
}
}
...
]
代码与模型:
(一) 提交算法完整代码,包括但不限于数据预处理、模型训练、目标检测等所有相关代码。请确保代码的完整性和可运行性
(二) 模型权重文件:参赛队伍需提交训练好的模型权重文件。
(三) README.md代码运行说明:必须包含一个清晰的模型代码说明文件(README.md),详细描述如何执行数据处理、模型训练与测试等步骤。且必须说明模型训练用到的数据集以及获取方式,预计模型训练和测试时间。请确保赛方能够仅根据您提供的说明和脚本,顺利地复现训练和测试结果。若赛队提供的README.md中缺失上述任何内容,队伍将无法获得评分。
提交格式:将上述的代码与模型的提交内容,需整理并打包成一个ZIP文件,并将ZIP文件命名为“PRCV2024_SARDet_队伍名.zip”,其中“队伍名”应替换为您的队伍名称,确保文件名的唯一性和识别性。
10、奖项设置
根据竞赛任务的评价方式,对排名前6名的参赛队伍,授予由竞赛组织方签发的冠、亚、季军获奖证书,并予以一定物质奖励(其中,一等奖一名,奖金12000元;二等奖两名,奖金6000元,三等奖三名,奖金4000元)。对于获奖队伍,可获得深势科技的实习机会,以及2023科学智能峰会参会名额,南开大学 VCIP 课题组保研面试及实习绿色通道。
11、挑战赛论坛
本竞赛将邀请所有参赛团队参加PRCV期间举行的研讨会,研讨会期间进行答辩。
12、 知识产权及其他注意事项
l 参赛团队提交算法及可执行模型的知识产权归参赛团队所有,竞赛视频、图像数据由南开大学VCIP课题组所有。
l 各参赛队在赛前需签订数据使用协议,承诺本竞赛提供的数据集仅能用于本竞赛,不用于除本竞赛外的任何其他用途。
l 各参赛队需要承诺本队提交的结果可重复,组织方承诺履行保密义务,并不用于除本比赛外的任何其他用途。
l 参赛队伍应保证所提供的方案、算法属于自有知识产权。组织方对参赛队伍因使用本队提供/完成的算法和结果而产生的任何实际侵权或者被任何第三方指控侵权概不负责。一旦上述情况和事件发生参赛队伍必须承担一切相关法律责任和经济赔偿责任并保护组织方免于承担该等责任。
l 参会的团队注册可与PRCV注册方式相同,标明参加竞赛研讨会,并支付注册费用。
参考文献
[1] Li, Yuxuan, Xiang Li, Weijie Li, Qibin Hou, Li Liu, Ming-Ming Cheng, and Jian Yang. "SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection." arXiv, 2024.
[2] Deng, Jia, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, and Li Fei-Fei. "Imagenet: A large-scale hierarchical image database." In CVPR, 2009.
[3] Lin, Tsung-Yi, Michael Maire, Serge Belongie, James Hays, Pietro Perona, Deva Ramanan, Piotr Dollár, and C. Lawrence Zitnick. "Microsoft coco: Common objects in context." In ECCV, 2014.
[4] Xia, G.S., Bai, X., Ding, J., Zhu, Z., Belongie, S., Luo, J., Datcu, M., Pelillo, M.Zhang, L.: DOTA: A large-scale dataset for object detection in aerial images. In CVPR, 2018.
[4] Hu, S.M., Liang, D., Yang, G.Y., Yang, G.W. and Zhou, W.Y. "Jittor: a novel deep learning framework with meta-operators and unified graph execution." Science China Information Sciences, 2020