会议程序

会议日程 主旨报告 特邀报告 专题论坛 女科学家论坛 讲习班 博士生论坛
点击论坛跳转到相应位置
可信具身视觉特征学习


论坛简介

在大模型的推动下,具身智能迎来了新的发展契机。作为实现具身智能的关键技术,具身视觉特征学习在视觉感知与认知过程中,充分融合了智能系统(如机器人、无人车、无人机等)的身体体验、活动与状态,以实现对视觉信息的精准获取、深度处理与理解。它着重强调智能本体与环境的动态互动,借助运动与主动感知能力,赋予智能系统理解和诠释视觉世界的新视角。当前,科研人员正致力于构建大规模具身视觉大模型,旨在模拟并预测身体的视觉感知与认知过程。与此同时,他们也在不断寻求更精确地模拟和理解智能系统状态与环境的方法,以及设计更为自然、高效的、更可信的交互方式,让智能系统具有更强的视觉感知和认知能力。为了深入挖掘可信具身视觉特征学习的前沿动态,本次论坛将特邀五位顶尖专家。他们将围绕该领域的最新研究突破、当前技术挑战以及未来发展趋势展开深入交流与探讨,以期推动可信具身视觉特征学习领域的持续发展与突破。论坛组织者包括上海交通大学孙仕亮教授、同济大学赵才荣教授、同济大学朱磊研究员、武汉大学叶茫教授、上海海事大学殷俊副教授。


论坛主席

640 (32).jpg


孙仕亮
上海交通大学教授



个人简介:

孙仕亮,上海交通大学教授,上海市计算机学会人工智能专委会主任,上海市图像图形学学会机器学习专委会主任。本科毕业于北京航空航天大学,博士毕业于清华大学,曾在University College London,Columbia University等海外高校从事访问研究。2011年至2023年在华东师范大学任职教授,2018年至2023年担任华东师范大学人工智能研究所常务副所长。主要研究方向为机器学习、人工智能。担任IEEE TPAMI、IEEE TNNLS、自动化学报等知名期刊编委。迄今发表学术论文200多篇,2020年出版中文教材《模式识别与机器学习》(清华大学出版社)。



640 (33).jpg

赵才荣
同济大学教授,智能信息处理教研室主任



个人简介:

赵才荣,工学博士。现任同济大学电子与信息工程学院计算机系教授,博士生导师,智能信息处理教研室主任。曾任香港理工大学兼职研究员(2016-2017)。目前担任上海市计算机学会计算机视觉专委会主任,中国图象图形学学会青工委副秘书长,中国自动化学会模式识别与机器智能专业委员会副秘书长,中国人工智能学会粒计算与知识发现专委常委,中国计算机学会杰出会员,担任IEEE TMM Guest Editor、 IET IP Associate Editor、《中国图象图形学报》、《计算机科学》编委。主要研究领域:计算机视觉,主要聚焦于智能视频行人分析及其隐私安全研究,重点研究高效可信行人再识别、多模态数据驱动的自动驾驶以及垂直领域模型的知识表示与推理问题。已在TPAMI、IJCV、IEEE TIP、IEEE TIFS、《中国科学.信息科学》等国内外重要学术期刊及国际学术会议CVPR,ICML,ICLR,AAAI,ACM MM等发表论文50余篇,受理发明专利20余项(授权14项),研究成果获2022年上海市科技进步一等奖(排名第四),获《中国科学:信息科学》2023年度热点论文奖。主持国家自然科学基金4项,主持国家重点研发计划子课题以及企业横向课题十余项。建设国家级线下精品课程1门,上海市精品课程1门。指导学生获中国电子学会优秀硕士论文,获上海市计算机学会优秀硕士论文。



640 (34).jpg

朱磊
同济大学研究员



个人简介:

朱磊,同济大学研究员,博士生导师。目前主要研究方向是高效能多模态大模型和自主具身智能。共发表中国计算机学会推荐(下简称CCF) A类会议长文、ACM/IEEE汇刊论文百余篇,主编英文学术专著2部,ESI高被引/热点论文8篇,Google引用8400多次,H因子47。获得CCF A类会议ACM SIGIR 2019和ACM MM 2019的最佳论文提名,CCF C类会议ADMA 2020最佳论文奖,ChinaMM 2022最佳学生论文奖,1篇论文入选2019年中国百篇最具影响国际学术论文,拥有授权专利22件。担任ACM TOMM、IEEE TBD、Information Sciences等多个国际期刊的编委,CCF A类会议的领域主席(AC)或高级程序委员会委员(SPC),CSIG青年工作委员会副秘书长。主持/参与基金委青年/面上/重点等10余项横纵课题。获得山东省自然科学二等奖(序1),吴文俊人工智能自然科学二等奖(序2),ACM中国SIGMM新星奖,中国图象图形学学会(CSIG)青年工作突出贡献奖,连续4年入选斯坦福大学发布的全球前2%顶尖科学家榜单,获Reseach.com发布的Rising Star of Science Award。指导研究生获中国自动化学会优秀硕士生学位论文奖和入选中国电子学会硕士学位论文激励计划。



640 (35).jpg

叶茫
武汉大学教授,国家高层次青年人才



个人简介:

叶茫,武汉大学教授、博士生导师,国家高层次青年人才,中国科协青年托举人才,湖北省高层次人才。主要研究方向人工智能、多媒体检索、多模态理解、联邦学习等,发表国际期刊会议论文 90 余篇,其中第一/通讯作者发表 CCF-A 类论文50余篇,谷歌学术引用 8000 余次。担任CCF-A类期刊IEEE TIFS等期刊编委,多次担任CVPR、ACM MM、ECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021年斯坦福排行榜 “全球前2%顶尖科学家”、2022年度百度AI华人青年学者等荣誉。指导学生获CCF优秀大学生、中国电子学会优秀硕士论文和国自科博士科研基金。



640 (36).jpg

殷俊
上海海事大学副教授,上海市浦江人才



个人简介:

殷俊,博士,上海海事大学信息工程学院副教授,上海市浦江人才。分别于2006年、2011年获得南京理工大学学士、博士学位,2016~2020年在华东师范大学从事博士后研究,2019~2020年在美国匹兹堡大学访问。主要研究方向是多视图学习、对比学习等机器学习理论及应用。目前担任国际期刊Expert Systems and Applications、Neural Processing Letters编委、上海市计算机学会人工智能专委会副主任。在IEEE TKDE、IEEE TNNLS、PR、Information Fusion等国际期刊以及AAAI、ACM MM等国际会议上发表论文50余篇,获2023年度中国自动化学会自然科学一等奖(排名第四)、2023年度IEEE TNNLS杰出论文奖。主持国家自然科学基金面上/青年项目、上海市自然科学基金青年项目、中国博士后科学基金面上项目。



论坛日程


时间:

2024年10月19日17:30-19:35


640 (80).jpg


论坛报告


640 (37).jpg


吴小俊
IAPR/AAIA/AIIA Fellow、江南大学至善教授、研究生院院长、Josef Kittler人工智能研究院院长



报告题目:

黎曼流形上的深度学习(17:30-17:55)


报告摘要:

由于视觉信息坐落在黎曼流形上,因此在黎曼流形上进行深度学习算法的研究将是一种本征的深度学习范式。本报告首先对黎曼流形和黎曼流形学习作简单介绍,然后通过几个案例给出在黎曼流形上设计深度学习算法的思想和方法。本报告还将介绍黎曼深度学习在图像质量增强、目标跟踪与识别、行为识别以及视觉融合等方面的应用研究。


个人简介:

吴小俊,国际模式识别协会会士(IAPR Fellow)、亚太人工智能协会会士(AAIA Fellow)、国际人工智能产业联盟产业研究院院士(AIIA Fellow)、江南大学至善教授、研究生院院长、Josef Kittler人工智能研究院院长、教育部装发创新团队负责人、科技部中英人工智能联合实验室主任、教育部/江苏省人工智能国际合作联合实验室主任、2006年教育部新世纪优秀人才、江苏省333工程第一层次人才。从事模式识别与人工智能的研究,在TPAMI、IJCV、TIP、CVPR、ICCV、ECCV、IJCAI、AAAI等期刊和会议上发表学术论文400余篇,出版学术著作5本。研究成果获得国内外学术奖励30余项,其中包括多项国际竞赛冠军、国际会议最佳论文奖、IETE Gowri Memorial Award 、教育部科技进步一等奖、合作者Josef Kittler院士获2015江苏省国际科技合作奖和2016中国政府友谊奖;担任了2项国家重点研发计划项目首席科学家、3项国家自然基金重点项目和多项GF项目负责人。现任IEEE智慧城市指导委员会委员、多本国际期刊主编或编委、教育部计算机类教学指导委员会委员、中国图像图形学会理事和江苏省人工智能学会副理事长等职。



640 (38).jpg


孟德宇
西安交通大学教授



报告题目:

机器学习的数学技术17:55-18:20


报告摘要:

以深度学习/大模型为代表的机器学习方法与技术为当今科技领域的研究焦点。然而,相比技术水平的迅猛提升,机器学习基础理论研究进展远远滞后,大量技术经验发现无法找到理论支撑,以科学性为前提的学科大厦面临危局。重建机器学习理论体系已成为当今重大科技前沿问题。针对这一挑战,本报告将以深度学习三大技术实验现象(任务泛化能力、智能涌现现象、鲁棒-精确悖论)理论内涵作为分析对象,介绍未来机器学习理论可能发展的新型学习、统计与物理理论新框架,以及本研究组分别针对通信、生命、医疗技术领域的场景动态适应、生命智能涌现、智能可靠诊疗三大技术问题的机器学习数学技术方面的初步探索。


个人简介:

孟德宇,西安交通大学教授,博导,任大数据算法与分析技术国家工程实验室机器学习教研室负责人。发表论文百余篇,谷歌学术引用超过29000次。现任IEEE Trans. PAMI,NSR等7个国内外期刊编委。目前主要研究聚焦于元学习、概率机器学习、可解释性神经网络等机器学习基础研究问题。



640 (39).jpg


严严
厦门大学教授,计算机系教工党支部副书记



报告题目:

高精度人脸表情识别技术研究18:20-18:45


报告摘要:

人脸表情识别具有重要的研究价值。为了实现有效的人脸表情识别,学习鲁棒的表情特征至关重要。然而,人脸表情图像常常受到人脸身份、光照、姿态等因素的影响,严重干扰了表情特征的提取。同时,不同表情之间也存在着极大的相似性。上述问题使得人脸表情识别面临极大的挑战,精度急剧下降。本次报告将介绍我们组最近在人脸表情识别方面的3个研究工作。第一个是基于特征解构与重构学习的人脸表情识别方法。第二个是一种基于干扰分离学习的人脸表情识别方法。第三个是一种基于解耦表示学习的人脸表情识别方法。最后,简要介绍我们在人脸属性识别上的一些研究。

报告人简介:

严严,厦门大学信息学院计算机系教授,博士生导师,计算机系教工党支部副书记。现为国际知名期刊Neurocomputing(JCR 2区)、Visual Computer(JCR 2区)责任编委(Associate Editor)、计算机研究与发展(CCF 中文期刊A类)青年编委、中国图象图形学报(CCF 中文期刊B类)青年编委、IEEE高级会员、CCF高级会员、CCF计算机视觉专委会委员、福建省计算机学会第九届理事会理事、福建省和厦门市高层次人才(B类)。近年来在IEEE T-PAMI(JCR 1区,CCF A类)、IJCV(JCR 1区,CCF A类)、IEEE T-Cyber、IEEE T-IP、IEEE-TMM、IEEE T-AC、IEEE T-ITS、PR、中国科学-信息科学、计算机学报、自动化学报等国内外著名期刊以及ICCV(CCF A类)、CVPR(CCF A类)、ACM MM(CCF A类)、AAAI(CCF A类)、ECCV(CCF B类)等国际著名会议上发表论文100余篇(JCR 3区以上SCI论文50余篇,CCF A类和IEEE Trans论文40余篇),其中以第一作者或通信作者发表SCI论文50余篇(其中JCR 2区以上论文30篇以上),参与出版人脸识别学术专著一部。此外,已获批发明专利30余项。



640 (40).jpg


邹征夏
北京航空航天大学教授,国家级青年人才



报告题目:

生成式遥感基础模型初探18:45-19:10


报告摘要:

遥感基础模型(大模型)作为遥感技术与智能前沿的交叉融合,是空天信息领域的基础前沿方向。生成式遥感基础模型作为其中的一类重要分支,在数字化遥感场景构建、赋能下游遥感图像解译等任务都起着关键的作用。在本次报告中,讲者将介绍课题组近期在遥感生成式基础模型方面的相关工作,包括全球范围遥感图像生成、多模态遥感图文生成。最后,对生成式遥感基础模型的潜在应用场景和未来研究方向进行介绍。


报告人简介:

邹征夏,北京航空航天大学宇航学院教授、博士生导师,国家级青年人才。主要研究方向包括遥感图像处理、计算机视觉、深度学习等,研究成果以第一/通讯作者身份发表在Proceedings of the IEEE、Nature Communications(首页论文)、IEEE Transactions汇刊、CVPR、ICCV等重要期刊和会议,谷歌学术论文引用6000余次,单篇论文引用2000余次。入选2022/2023全球前2%科学家名单,担任Nature旗下期刊Communications Engineering特刊编辑,研究成果收录于斯坦福大学著名公开课,被新华社、中央电视台、新科学人等媒体报道和采用,服务于航天国防、自动驾驶等重要应用。



640 (41).jpg


徐婧林
北京科技大学副教授



报告题目:

面向行为理解的细粒度运动分析19:10-19:35


报告摘要:

细粒度运动分析旨在通过精细化地分析人体动作序列,实现动作的细粒度识别、定位、姿态估计、质量评价,可广泛应用于智能安防、智慧医疗、智能体育、智慧传媒等领域。本报告首先介绍细粒度运动分析面临的挑战与意义,重点介绍文本驱动的细粒度时空动作定位、细粒度提示驱动的三维人体姿态估计、以人为中心的细粒度动作质量评价,回答如何在时间和空间上定位边界模糊的细粒度动作、如何在三维空间中估计深度不确定的人体姿态、如何从细粒度层面更精确地评价人体动作质量?上述研究工作将在运动康复、体能测试、数字传媒等领域具有重要意义。


报告人简介:

徐婧林,北京科技大学智能科学与技术学院副教授,北京图象图形学学会理事、副秘书长。入选第九届中国科协青年人才托举工程、2022年获中国图象图形学学会优秀博士学位论文奖、2023年获中国自动化学会自然科学奖一等奖(4/5)。主要研究方向为视频动作理解、多模态细粒度分析、三维人体姿态估计与动作生成。已发表/接收18篇CCF A类国际期刊和会议论文(一作14篇,通讯1篇)。代表性一作论文包括:CVPR论文5篇(2篇Oral/1篇Spotlight/1篇Highlight)、IEEE TIP论文3篇、IEEE TKDE论文1篇、AAAI和IJCAI论文5篇。主持国家自然科学基金面上项目、青年基金、中国博士后科学基金面上项目等。获得北京图象图形学学会“最美女科技工作者”称号、2022年西北工业大学优秀博士学位论文、2020年西北工业大学优秀毕业生等荣誉。担任《电子与信息学报》编委、《计算机科学》青年编委、《人工智能》编委等。




官方公众号