论坛介绍
论坛旨在为高校博士研究生提供一个学术交流和研讨平台,通过博士生学术报告、科研专家现场指导,大家交流学术思想、传递科研经验、增进彼此友谊,拓宽青年人才学术视野、培养创新能力、激发学术热情。
论坛主席及交流嘉宾
中国科学院自动化研究所研究员,国家高层次青年科技人才计划
个人简介:
哈尔滨工业大学教授
个人简介:
左旺孟,哈尔滨工业大学计算机学院教授、博士生导师。主要从事底层视觉、视觉生成、视觉理解和多模态学习等方面的研究。在CVPR/ ICCV/ECCV/NeurIPS/ICLR等顶级会议和T-PAMI、IJCV及IEEE Trans.等期刊上发表论文200余篇,谷歌学术引用60,000余次。曾任ICCV、CVPR等CCF-A类会议领域主席,现任IEEE T-PAMI、T-IP、中国科学-信息科学、自动化学报等期刊编委。
天津大学北洋讲席教授,国家优青/杰青
个人简介:
胡清华,国家优青/杰青,天津大学北洋讲席教授,天津市机器学习重点实验室主任,城市智能与数字治理教育部工程研究中心主任,CAAI粒计算与知识发现专委会主任。从事大数据粒计算、多模态学习、不确定性建模和自主机器学习方面的研究,先后获得国家重点研发计划项目、国家自然基金重点项目、国家优青/杰青以及国防项目的资助。在IEEE-TPAMI、IJCV、IEEE-TKDE、IEEE-TFS等期刊以及NeurIPS、CVPR、IJCAI、AAAI等会议发表论文300余篇,获批发明专利30余个,出版专著3部,先后获得黑龙江省自然科学一等奖和天津市科技进步一等奖。目前担任IEEE Trans. Fuzzy Systems,自动化学报、电子学报、智能系统学报等期刊的编委。
南开大学杰出教授,国家优青/杰青
个人简介:
程明明,南开大学杰出教授,主持承担了国家杰出青年科学基金、优秀青年科学基金项目、科技部重大项目课题等。他的主要研究方向是计算机视觉和计算机图形学,在SCI一区/CCF A类刊物上发表学术论文100余篇(含IEEE TPAMI论文30余篇),h-index为80,论文谷歌引用4万余次,单篇最高引用4700余次,多次入选全球高被引科学家和中国高被引学者。技术成果被应用于华为、国家减灾中心等多个单位的旗舰产品。获得教育部自然科学一等奖2项、其他省部级科技奖2项。培养的3名博士生获得省部级优秀博士论文奖。现担任中国图象图形学学会副秘书长、天津市人工智能学会副理事长和顶级期刊IEEE TPAMI, IEEE TIP和《中国科学:信息科学》编委。
北京交通大学教授,国家高层次人才计划
个人简介:
魏云超,北京交通大学教授,国家高层次人才计划获得者。曾在新加坡国立大学、美国伊利诺伊大学厄巴纳-香槟分校、悉尼科技大学从事研究工作。主要研究方向包括面向非完美数据的视觉感知、多模态数据分析、生成式人工智能等。入选MIT TR35 China、百度全球高潜力华人青年学者、《澳大利亚人》TOP 40 Rising star,获世界互联网大会领先科技奖(2023)、教育部高等学校自然科学奖一等奖(2022)、中国图象图形学学会科技技术奖一等奖(2019)、澳大利亚研究委员会青年研究奖(2019)、IBM C35R最佳研究奖(2019)、计算机视觉世界杯ImageNet目标检测冠军(2014)及多项CVPR竞赛冠军。
清华大学长聘副教授,国家青年特聘专家
个人简介:
高跃,清华大学长聘副教授、博士生导师,国家青年特聘专家、DeepTech 2022年中国智能计算科技创新人物。主要研究领域为人工智能、计算机视觉及医学图像处理,提出并发展了超图计算理论及方法,实现了高阶关联的结构建模与计算,有效应对数据不足和信息关联复杂等挑战,应用于视觉目标检测、医学辅助诊断等领域。研究成果在IEEE TPAMI等发表论文百余篇,论文引用万余次,出版《Hypergraph Computation》等英文专著,多次入选科睿唯安高被引科学家和爱思唯尔中国高被引学者,担任International Journal of Computer Vision和Medical Image Analysis等国际重要期刊编委。曾获得中国电子学会自然科学一等奖、福建省科技进步一等奖等。
哈尔滨工业大学教授,黑龙江省政府特殊津贴专家,教育部"新世纪优秀人才"
个人简介:
姚鸿勋,哈尔滨工业大学长聘教授,黑龙江省政府特殊津贴专家,教育部"新世纪优秀人才",AI全球2000位最具影响力学者 (AMiner机构发布),哈工大人工智能专业负责人。任中国图象图形学学会常务理事,中国图象图形学学会情感计算与理解专业委员会主任,黑龙江省人工智能学会常务理事,中国计算机学会多媒体专委会委员;主要研究领域为计算机视觉智能、多媒体数据分析与理解、模式识别、情感计算。发表 ICCV, CVPR, ACM MM等顶级国际会议及TPAMI, IJCV, TIP, TMM等高影响因子国际期刊文章学术论文 200余篇,H指数>40。
西安电子科技大学教授,教育部"新世纪优秀人才",长江学者特聘教授、国家百千万人才工程
个人简介:
邓成,西安电子科技大学教授、博士生导师,分别在西安电子科技大学取得学士、硕士和博士学位。2012年入选教育部新世纪优秀人才,2017年入选陕西省中青年科技创新领军人才,2018年获得陕西省青年科技奖。2020年入选长江学者特聘教授、国家百千万人才工程、陕西省师德标兵。主要研究多模态数据智能分析与推理。主持包括国家自然科学基金面上基金、科技部“863”计划、陕西省重点研发计划等科研课题近30项。近5年,在国际SCI一区/二区刊物IEEE T-NNLS、T-CYB、T-IP、T-MM、T-CSVT等发表论文40余篇,在CCF A类会议ICML、NeurIPS、ICCV、CVPR、KDD、AAAI、IJCAI等发表论文50余篇。现担任国际知名期刊Pattern Recognition、Neurocomputing、Pattern Recognition Letters的副编辑;担任多个国际学术会议的领域主席、高级程序委员等,如CVPR2021、IJCAI2020、IJCAI2019、ICME2020、ICPR2018等,以及近20余个国际刊物的审稿人,如IEEE T-PAMI、T-IP、T-CYB、T-NNLS、IJCV等。
论坛日程
时间:
2024年10月18日15:30-17:15
论坛报告
报告题目:
基于信息融合的细粒度图像分类方法研究
报告摘要:
个人简介:
常东良,清华大学自动化系博士后,国家资助博士后研究人员计划(B档)获得者,研究方向为细粒度图像理解。共发表论文40余篇,其中15篇为CCF A类论文,谷歌学术引用超2000次。主持国家青年基金和中国博士后科学基金面上项目。
南京理工大学在读博士
报告题目:
恶劣环境下的视觉增强与计算
报告摘要:
个人简介:
陈翔,南京理工大学博士生,师从潘金山教授。研究方向为恶劣环境下的视觉增强。目前在CCF/CAAI-A类会议和期刊上发表多篇论文。相关研究工作获华为终端Camera学术之星、首届“中国宇航学会高水平学位论文激励计划”等荣誉奖励。
北京大学博士后
报告题目:
神经形态事件与传统图像的互补增强机制报告摘要:
脉冲相机、事件相机等神经形态相机,对比逐帧成像的普通相机,拥有独特的优势,尤其是其对于高速运动物体和高动态范围场景的感知能力。本报告以事件相机为例,介绍神经形态与传统相机融合并互补增强成像质量和提升场景感知的计算摄像方法与系统,具体从三个方面展开:首先,介绍传统图像如何增强事件信号的质量,对其进行去噪、超分辨率操作并建立其与传统图像的关键点数据匹配;其次,介绍事件信号如何引导提升图像动态范围,消除图像模糊,矫正卷帘快门果冻效应。最后,介绍事件信号如何结合图像实现快速的直接/全局光照分解。
报告人简介:
段沛奇,于2023年从北京大学计算机学院获得理学博士学位。现为北京大学计算机学院博雅博士后,从事神经形态相机辅助高质量成像研究,在相关领域发表论文11篇。入选2023年度“博士后创新人才支持计划”(“博新计划”),主持国家自然科学基金青年科学基金、博士后科学基金面上资助等多个项目。担任 IEEE TPAMI, TIP, TMM, TCSVT, ACM 等重要国际期刊审稿人,担任 CVPR, ICCV, ECCV, NeurIPS, AAAI, ICLR 等重要国际学术会议审稿人。
南京大学在读博士
报告题目:
报告摘要:
上下文学习 (In-Context Leaning, ICL)作为一种新的学习范式,能够通过大模型的类比推理能力在有限的示例对输入下完成各类生成任务。然而,与语言模型相比,视觉上下文学习在任务理解能力、学习效率与任务泛化性等方面仍存在诸多挑战。本报告回顾视觉上下文学习的发展脉络,并介绍一种基于预训练扩散模型的视觉上下文学习方法,该方法能够同时利用视觉提示与文本提示,通过类比推理的方式执行各类视觉生成任务,最后探讨目前存在的问题以及未来发展方向。
报告人简介:
顾峥,南京大学计算机学院在读博士,导师为高阳教授,同时他是香港城市大学电脑科学系联合培养博士,导师为廖菁副教授,他的研究方向为开放场景下的视觉感知与生成。
武汉大学在读博士
报告题目:
异构联邦学习
报告摘要:
联邦学习作为一种安全隐私多方合作范式,能实现数据可用不可见,数据不动模型动。因而,在数据隐私受限的场景下,联邦学习可以赋能数据敏感需要大量数据的领域,譬如大模型训练,医疗等领域。而现有联邦学习体系通常建立在数据相同分布且模型相同架构的设定,而实际环境下存在如下问题:数据采集方式不同数据分布差异大、参与者合作意图难辨别恶意攻击抵挡难、用户自行设计模型模型结构不相同。针对以上问题,提出面向多域泛化的联邦领域约束学习方式、异构场景下恶意行为的统一建模与解耦合联邦框架等理论研究方法,有效推动联邦学习在实际部署应用场景下的泛化性,鲁棒性和兼容性,也为面向安全可靠和自主可控的的新一代人工智能研究及实际应用提供重要的技术支撑和理论。
报告人简介:
黄文柯,武汉大学计算机学院人工智能系23级博士生,导师为叶茫教授和杜博教授。研究方向为联邦学习。目前已于CCF-A类会议和期刊上发文17篇,第一和共一14篇,包含IEEE TPAMI 2篇、CVPR 3篇。曾在微软亚洲研究院、阿里巴巴集团担任研究实习生,主持国家自然科学基金青年学生基础研究项目。
陆军工程大学(石家庄校区)在读博士
报告题目:
红外小目标检测技术进展与开源测评框架探索
报告摘要:
远距离红外小目标检测技术被广泛运用在侦察、预警等领域,其检测性能和效率将直接决定行动的成功与否,任何微小的延时和误判都可能导致严重的后果。因此,如何提升红外小目标检测技术的性能,确保准确、迅速识别并跟踪远距离目标一直是计算机视觉领域研究的热点。近几十年来有大量的红外小目标检测算法被相继提出,这些算法经历了从低层特征建模到高层深度学习的巨大跃进,而与之伴随的评价指标呈现出多样化和不统一的特点。为进一步规范该领域评价体系,此次报告旨在系统梳理红外小目标检测领域的评价指标,并在深入调研的基础上提出客观统一的评价标准。具体而言,首先以红外小目标检测技术的发展历程为脉络回顾了与之伴随的评价指标的演进过程;其次,全面总结了目前广泛使用的评价指标,剖析了其优缺点和内在联系。为进一步了解领域专家的观点和使用习惯,我们对 39 位知名学者进行了问卷调查,并统计分析了 91 篇权威文献,重点探求了评价指标细节设置上的异同。综合调研结果,给出了优化的评价指标体系和配套的使用规范,并对现有评价指标的局限性进行了讨论,提出了未来改进和拓展的研究方向。
报告人简介:
深圳大学在读博士
报告题目:
人脸图文多模态生成式预训练模型
报告摘要:
报告简述了人脸领域图文多模态预训练工作,包括人脸双向图文生成模型、基于自监督的人脸编辑模型、大规模人脸领域图文数据集及对比学习模型等。
报告人简介:
北京邮电大学在读博士
报告题目:
基于2D先验的3D资产材质生成
报告摘要:
在强大的2D生成先验的驱动下,最近的研究已经成功地从文本或视觉引导中自动创建3D对象。然而,这种二维图像先验会影响光照和阴影的效果。使用分数蒸馏采样(SDS)优化的材料图不可避免地涉及无关信息。缺乏精确的材料使得生成的资产在新场景中难以重新渲染,这限制了它们在下游应用中的可用性。从艺术家的角度,可以根据对象的外观和语义推断出材料信息。受此启发,我们提出一个3D资产材料生成框架MaterialSeg3D,首次采用基于感知的分割方法,直接从物体的多视图渲染中预测材料,并有2D先验的监督。
报告人简介:
李泽宇,北京邮电大学人工智能学院博士二年级在读,指导老师为张曼教授,研究方向为3D场景重建、3D资产表面材质生成。
国防科技大学在读博士
报告题目:
结构化知识表示与推理
报告摘要:
现有结构化知识表示普遍面临图结构先验信息利用少、全图信息聚合慢、多源信息融合难等问题,影响了方法的推理能力。因此,如何设计强表达性、高效率和多源性的结构化知识表示学习方法是知识图谱相关研究中亟待开展的课题。汇报者在博士期间致力于克服现有结构化知识表示与推理中存在的研究难点,从静态知识图谱和引入额外信息的时序、多模态知识图谱两个角度出发,探索了现有包括对比学习、图神经网络、Transformer、多模态学习在内的多种先进人工智能技术与知识图谱表示学习方法相结合的可行方案,以提升现有方法的表征质量,为推动该领域的发展提供新思路、新技术和新途径。
报告人简介:
国防科技大学在读博士
报告题目:
深度时序图聚类
报告摘要:
深度图聚类最近受到了广泛的关注,因其能够增强模型在无监督场景下的表示学习能力。然而,作为可以捕获关键的动态交互信息的时序图,其上的深度聚类尚未得到充分的探索。这意味着在许多面向聚类的现实场景中,时序图只能作为静态图来处理。这不仅会导致动态信息的丢失,还会引发巨大的计算消耗。为了解决这个问题,本文提出了一种称为TGC的深度时序图聚类框架,通过改进深度聚类技术来适应基于交互序列的时序图批处理模式。此外,本文从多个层面讨论了时间图聚类与静态图聚类的区别。大量在TGC框架上的实验表明,时序图聚类可以更灵活地在时间和空间需求之间找到平衡。
报告人简介:
刘猛,国防科技大学博士生,师从刘新旺教授。方向为图神经网络和聚类。一作在ICLR、MM、TNNLS等刊物发表论文9篇,被引500余次。获2024中国算力大会最佳论文,CCHI2023最佳学生论文、国家奖学金等。担任TKDE、TNNLS、 NeurIPS、ICML等审稿人。
宁夏大学在读博士
报告题目:
基于图第一性原理的模式生成
报告摘要:
模式生成是AIGC领域中的核心重要任务。目标模式作为模式生成的重要组成部分,其符合物理真实和理论一致特性为模式生成提供更高的可靠性和有效性。针对符合特定约束的目标模式生成技术通常存在着一致性差、生成质量难以控制等问题。基于图第一性原理的模式生成结合图论与系统的起源性要素捕捉模式的本质特征,并通过第一性原理确保生成模式符合物理真实和理论一致性,实现对复杂模式的生成与构建。具体研究内容包括:1)基于等势图的跨模态生成方法,旨在挖掘不同模态之间的内在联系,提升生成模型在多样性和一致性上的表现;2) 基于孪生图的多标签生成方法,构建彼此关联的孪生图结构,有效促进多标签数据的生成与优化,解决传统方法中因标签稀疏性带来的生成挑战;3) 基于等变图的新材料生成方法,聚焦于材料特性与结构对称性之间的内在联系,利用等变性原理提升新材料的设计效率和性能。
报告人简介:
马梅,宁夏大学物理学博士研究生,宁夏大学HCTC团队核心成员。曾荣获省级优秀硕士学位论文。主要研究方向:医学图像生成、材料智能计算。
西安电子科技大学在读博士
报告题目:
通用场景下深度神经网络不公平问题的几何机制与优化
报告摘要:
样本不平衡被广泛认为是模型偏差的来源,为了解决数据长尾分布的挑战,研究人员提出了多种方法来减少模型偏差,其中大多数方法假设样本较少的类别是弱类别。然而,最近的研究表明,即使在完全平衡的数据集上进行训练,深度神经网络也会表现出类别偏见,这是现有理论无法解释的现象。为了解决和改善深度神经网络中更广泛的不公平问题,系统的提出了模型公平性的几何分析视角,提出了深度神经网络中感知流形的概念,和一系列用于深度神经网络中感知流形几何特性的度量。通过一系列实验发现,感知流形的几何特性与模型公平性之间存在显著相关性。一系列工作从几何角度解释了模型偏差的产生机制,提醒研究人员关注非长尾甚至样本均衡数据集上的模型偏差问题。
报告人简介:
马彦彪,西安电子科技大学人工智能学院2020级直博生,师从焦李成教授。以第一作者在IJCV,ICLR,CVPR,ACM MM,TMM,JSTARS等期刊和会议发表学术论文7篇。获得由CVPR,ICCV,ECCV以及IGARSS组织的国际竞赛冠军5项,亚军和季军各1项,其中包括多时相,多模态,多光谱数据用于无电居民区检测竞赛冠军,洪水灾害中的无人机航拍图像视觉问答竞赛冠军等。长期担任AAAI,NeurIPS,ICML,ICLR,CVPR,TNNLS,TMM等会议和期刊审稿人。
安徽大学博士后
报告题目:
基于结构化Transformer模型的视觉表示学习
报告摘要:
视觉表示学习(Visual Representation Learning)是计算机视觉领域中的一项核心任务,旨在从原始的像素数据中提炼出能够揭示图像本质属性和语义信息的有效特征,从而为图像分类、目标检测、图像检索等后续任务提供坚实基础。随着深度学习技术的飞速发展,特别是Transformer模型的引入,通过将Transformer与卷积神经网络(CNN)相结合或完全替代CNN,可以实现对图像数据更为高效的表示学习。然而,现有的视觉Transformer方法大多沿用传统的Transformer架构,这存在以下问题。首先,这些方法主要关注图像内上下文关系建模,忽视了不同图像样本间的相关性;其次,这些方法在处理多模态数据时忽视了不同模态图像间固有结构关系建模,使得模型可能因模态差异问题而获得次优性能。本报告将介绍我们在这两个问题上的相关研究,旨在为视觉表示学习带来新的方法和思路。
报告人简介:
电子科技大学在读博士
报告题目:
基于模型驱动的红外小目标检测网络
报告摘要:
随着深度学习的兴起与数据集的丰富,基于神经网络的红外小目标检测得到了长足的长进。然而,大多数方法专注于利用主流网络对红外图像进行处理,忽略了红外信息的本质,导致了一定的“黑盒”效应。为了解决以上问题,我们专注将传统可信的红外小目标方法进行深度展开,将具有物理信息的传统算子及低秩稀疏等传统算法进行网络化实现,打造一系列近“白盒”的红外小目标检测网络。
报告人简介:
Fengyi Wu is pursuing his Ph.D. at the School of Information and Communication Engineering, University of Electronic Science and Technology of China (UESTC), supervised by Prof. Zhenming Peng. Currently, his research interests focus on optimization-based methods with applications in signal and image processing, learning, and computer vision。
香港中文大学(深圳)在读博士
报告题目:
以人为中心的感知,理解,推理和生成
报告摘要:
在动态复杂的环境中,构建一个能够感知、分析和解释人类与物体状态及其潜在动机的系统,依然是一个重大且充满挑战的问题。本报告围绕开放世界下的以人为中心的感知、理解、推理和生成,提出了三个核心研究问题:(1)X-Pose: Detecting Any Keypoints (专注于感知任意物体) ;(2)Open-World Human-Object Interaction Detection via Multi-modal Prompts(旨在感知人和物体的交互状态);(3)F-HOI: Toward Fine-grained Semantic-Aligned 3D Human-Object Interactions (探索三维环境中人-物交互关系的理解,推理与生成)
报告人简介:
新加坡南洋理工大学在读博士
报告题目:
Unleashing Diffusion Models for Low-Level Vision
报告摘要:
最近,随着视觉生成模型的飞速发展,它们正逐渐成为探索底层视觉任务的强大引擎。生成模型凭借其卓越的生成能力,显著提升了底层视觉模型的性能,使得输出画质有了质的提升。然而,这种强大的生成能力也如同一把双刃剑,模型输出常常伴随着纹理改变,给底层视觉模型的设计带来新的问题和挑战。本报告将探讨Diffusion生成模型如何驱动不同底层视觉任务的探索与进步。
报告人简介:
周尚辰:新加坡南洋理工大学MMLab@NTU博士生,师从Chen Change Loy教授。他在计算机视觉领域的顶级会议和期刊,如CVPR、ICCV、ECCV、NeurIPS、TPAMI等上发表了多篇论文,谷歌引用超过3600次。他曾获得国家优秀自费留学生奖学金,WAIC青年优秀论文提名奖,ICIMCS最佳论文奖,并在NTIRE视频复原比赛中获得三项冠军。他还与ECCV2022、CVPR2023和CVPR2024会议上参与组织了移动智能摄影和成像(MIPI)国际系列研讨会。目前主要研究兴趣包括图像/视频增强、生成模型。个人主页:https://shangchenzhou.com
香港中文大学(深圳)在读博士
报告题目:
Breaking the False Sense of Security in Backdoor Defense through Re-Activation Attack
报告摘要:
深度神经网络在防御后门攻击方面一直面临挑战,导致攻防双方持续较量。虽然现有的后门防御策略在降低攻击成功率方面表现出色,但我们能否自信地宣称后门威胁已真正从模型中消除?为此,我们重新研究了防御后被植入后门的模型(称为防御模型)的特征。令人惊讶的是,我们发现在现有的训练后防御策略衍生的防御模型中,原始后门仍然存在,后门的存在性通过一个称为后门存在系数的新指标来衡量。这意味着后门只是处于休眠状态,而不是被消除。为了进一步验证这一发现,我们通过实证表明,这些休眠的后门可以在推理过程中轻松地重新激活,方法是使用通用对抗攻击通过精心设计的微小扰动来操纵原始触发器。更实际的是,我们将后门重新激活扩展到黑盒场景,其中防御模型只能在推理期间被对手查询,并开发两种有效的方法,即基于查询和基于传输的后门重新激活攻击。在图像分类和多模态对比学习(即 CLIP)任务上验证了所提出方法的有效性。总之,这项工作揭示了现有防御策略中从未探索过的关键漏洞,强调了未来设计更强大、更先进的后门防御机制的紧迫性。
报告人简介: