会议程序

会议日程 主旨报告 特邀报告 PRCV & DICTA 2022联合论坛 专题论坛 女科学家论坛 讲习班 博士生论坛 录用论文/口头报告/学术海报展示
点击论坛跳转到相应位置
可视媒体计算、分析与理解

01

论坛日程

02

论坛嘉宾

江健民 报告嘉宾

深圳大学计算机软件学院特聘教授

嘉宾简介:回国前系英国萨里大学(Surrey University)的计算机系教授。于2014年全职加盟深圳大学并创立未来媒体技术与计算研究所(http://futuremedia.szu.edu.cn)。他于1994年获英国诺丁汉大学博士学位,同年任职于英国拉夫堡大学计算机系讲师。1997年出任英国格拉摩根大学计算机学院正教授,离获得博士学位仅三年多一点,是最早成为英国大学教授的大陆学者之一。曾任英国布拉德福大学(Bradford University)数字媒体首席教授(Chair Professor)和该校数字媒体与系统研究所所长,及英国萨里大学计算机系媒体计算方向的讲座教授。在英国获得过三十多项英国国家及欧盟框架科研计划的资助。总科研经费超过2500多万欧元,有着丰富的主持多国研究机构参与合作的大型研究项目的经验。他主持的由欧盟第七框架计划资助的中欧合作项目SCC-Computing,在国内外产生了较大的影响。合作单位包括英国的Surrey大学,保加利亚国家科学院,西班牙Zaragoza 大学, 挪威的Stavanger大学,瑞士的Della Svizzera Italiana大学,中国的天津超算中心及天津大学。本项目得到了欧洲及国内多家主流媒体的关注和报道(见下图),包括欧盟第七框架计划计算机分部的领导,BBC,中央电视台,新华社等。此外他于2000年获国家基金委海外杰青B类项目,在计算机科学领域发表英文学术论文近400余篇。

报告题目:脑视觉认知的探索研究与挑战

报告摘要:脑视觉认知的研究致力于揭示人脑通过视觉感知外部信息并对其做出认知判断的秘密。代表性的研究方法之一是让被试者观看不同类别的图像并进行识别后,采用计算机人工智能的手段通过对其脑电EEG信息的分析,来还原或捕捉被试者脑内识别和认知相关图像类别的过程。这种方法起源于Neuroscience 领域内采用定向脑激励模式来完成对人脑相关反应的分析。也包括心理学领域常用的二维选择性脑激励模式和脑科学领域常用的数字激励及基于计算机图型的激励模式等。这类方法在人机交互领域内涉及人脑的研究中也比较普遍,如采用人脑控制机器或动物的行为等。不过即使涉及复杂的控制过程但实际的脑机交互仍然是以多级二维选择的方式来实现的。2015年美国斯坦福大学的科研团队在全球率先使用目标图像直接激励人脑的方法,突破了传统的脑科学研究仅采用简单数字或图形激励的模式,完成包含6个类别的脑图像(视觉)认知的计算机分析及其自动分类的研究,相关的分类准确率达到40.68%。2017年美国佛罗里达大学的科研团队直接从ImageNet图像库内提取40个类别的图像用来激励人脑产生相应的脑电信号(EEG)并向全球发布了第一个脑电图像数据库ImageNet-EEG。在同年计算机视觉及人工智能的顶级学术会议CVPR2017上报告了他们采用深度学习的手段对40个类别的脑认知图像分类,取得了准确率高达82.9%的实验结果。对此,美国普渡大学的研究团队在2021年的CVPR上提出了否定的看法, 认为脑视觉认知的研究远不是如此的简单。本次讲座将在介绍目前脑视觉认知研究的相关背景基础上,深入剖析迄今为止脑视觉认知探索研究的现状及其面临的主要难点和挑战。同时分享深圳大学未来媒体技术与计算研究所在此领域内的最新探索及相关的研究计划。 

纪荣嵘 报告嘉宾

厦门大学南强特聘教授

嘉宾简介:纪荣嵘,厦门大学南强特聘教授,国家杰出青年科学基金获得者。主要研究方向为计算机视觉。近年来发表TPAMI、IJCV、ACM汇刊、IEEE汇刊、CVPR、NeurIPS等会议长⽂过百篇。论文谷歌学术引用万余次。曾获2016年教育部技术发明一等奖、2018年省科技进步一等奖、2019年福建省青年科技奖,2022年霍英东高等院校青年科技奖。曾/现主持国防973项目,国家自然科学基金联合重点基金等项目。任中国计算机学会A类国际会议CVPR和ACM Multimedia领域主席、中国图象图形学学会学术工委副主任、教育部电子信息类教指委人工智能专业建设咨询委员会委员。

报告题目:复杂跨媒体数据协同分析与应用

报告摘要:社交媒体包含了海量非合作、异构化、跨模态的数据,既蕴藏了大量的人类知识与高价值信息,也包含了各种自然与人为的噪声,对其分析与处理需要融合类脑计算、计算机视觉、自然语言处理等多个维度的智能技术。本报告主要关注基于深度学习的多模态内容协同分析与表示、跨模态信息融合及智能对抗攻防,介绍课题组在图像描述与视觉问答、语言指导的目标检测与分割、用户隐私保护、社交网络分析引导等方面的一些研究进展。

丁贵广 报告嘉宾

清华大学软件学院特别研究员、博士生导师

嘉宾简介:国家杰出青年科学基金获得者,清华大学软件学院副院长,北京信息科学与技术国家研究中心副主任。主要研究方向:以计算机视觉技术在国家公共安全、网络内容管理、自动驾驶和机器人等领域的实际需求为出发点,开展视觉感知理解、机器学习、数据检索等方面的研究,重点关注视觉感知理解、高效检索和弱监督学习理论与方法的研究,面向端侧和边缘侧计算能力有限、功耗限制高等场景,研究深度视觉模型压缩技术,研发端侧视觉计算系统和平台。课题组先后主持和基金委杰出青年科学基金项目、基金委重点项目、重点研发项目、国家973、863等项目数十项。发表高水平学术论文近百篇,获授权发明专利25项,相关成果成功应用于公安部二十三局、快手、新疆联海创智、数码视讯等单位,曾获国家科技进步二等奖、中国电子学会技术发明一等奖、中国人工智能学会吴文俊技术发明一等奖。

报告题目:深度学习模型架构优化技术

报告摘要:深度学习模型的端侧部署已经成为人工智能应用的主要形式之一,如智能手机、智能摄像头、自动驾驶等场景,然而深度学习模型复杂度高、参数量大,给端侧部署带来了巨大挑战,如何在不损失或较少损失模型精度的前提下,减小模型的计算复杂度是人工智能领域研究的重要方向之一。本次报告将介绍深度学习模型的压缩优化技术,包括模型减枝、参数稀疏化以及重参数化等压缩方法,以及项目组提出的“训大用小” 的训练和部署方法论、全局近似最优模型裁剪技术等。

胡瑞珍 报告嘉宾

深圳大学长聘副教授、博士生导师

嘉宾简介:研究方向为计算机图形学,长期从事智能几何建模与处理方面的研究,发表 ACM SIGGRAPH/TOG 论文二十篇;获广东省杰出青年项目、深圳市优青项目资助,入选中科协青年人才托举工程;曾荣获亚洲图形学协会青年学者奖、几何设计与计算青年学者奖、时谛智能CAD&CG青年学者奖;担任SCI期刊IEEE CG&A和The Visual Computer编委;担任国际会议CVM2023和SMI 2020程序委员会共同主席,连续多年担任SIGGRAPH等大会程序委员会委员;担任中国计算机学会计算机辅助设计与图形学专委会副秘书长、计算机图形学与混合现实在线平台(GAMES)线上活动运营负责人。

报告题目:三维交互的几何表征计算与学习

报告摘要:人类智能是在和环境交互中进化的,因此对三维交互进行有效表达、分析和处理是实现类人智能的关键。本报告将介绍多种三维交互的几何表征计算及其学习方法,并在其基础上进行的系列交互分析和生成工作,实现了复杂交互的定位与生成,规划了交互的动态执行过程,实现了对三维交互的高层次理解和优化。

郑伟诗 主持人

中山大学教授

嘉宾简介:郑伟诗,中山大学计算机学院教授、博导,现任中山大学计算机学院副院长、机器智能与先进计算教育部重点实验室副主任、大数据分析与应用技术国家工程实验室副主任。他致力研究协同感知与交互视觉媒体理解,实现(跨场景)目标追踪与行为感知与理解。他发表在CCF-A/中科院1区/Nature子刊 130多篇,其中在IEEE T-PAMI/IJCV/自然通讯发表20余篇。担任Pattern Recognition、《自动化学报》等期刊的编委,担任国际顶级学术会议ICCV、CVPR、IJCAI 等领域主席。作为负责人,主持承担国家自然科学基金委联合基金重点项目、国家重点研发课题、国家自然科学基金委联合重大项目课题、国家科技部重大攻关课题、国防科技基础加强项目等。曾担任ICME 2022程序委员会联合主席等。获中国图象图形学学会自然科学奖一等奖、广东省自然科学奖一等奖、广东省自然科学奖二等奖等;他是2020/2021年中国高被引学者(爱思唯尔)、入选2020/2021全球前2%顶尖科学家榜单(斯坦福大学)。获国家优秀青年科学基金、英国皇家学会牛顿高级学者基金和广东省创新领军人才项目支持。

官方公众号