会议程序

会议日程 主旨报告 特邀报告 PRCV & DICTA 2022联合论坛 专题论坛 女科学家论坛 讲习班 博士生论坛 录用论文/口头报告/学术海报展示
点击论坛跳转到相应位置
视觉神经信息编解码

01

论坛简介、目的与意义


基于脑科学和人工智能技术的新进展,本讲习班将邀请2位领域专家,对视觉神经信息编解码研究的现状、挑战和前景进行深入的介绍和讨论。视觉系统作为人类和外部世界进行交互的主要途径,能够稳定、高效、鲁棒地处理复杂的视觉刺激信息,具有当前计算机视觉所无法比拟的优越性。基于功能磁共振成像 (fMRI) 等神经影像的视觉神经信息编解码是理解、破译和模拟大脑视觉系统运作机制的重要研究途径,对于类脑智能技术的发展具有重要意义。视觉神经信息编码以大脑视觉感知机制为基础,通过建立大脑视觉信息处理的计算模型来描述大脑对外界刺激的响应过程,以实现对神经活动的预测。研究视觉神经信息编码,对于探索大脑视觉信息加工机制,提高人工视觉模型的感知和认知能力具有重要意义。与此相反,视觉神经信息解码则主要通过分析大脑信号数据,从中找到其与外界视觉刺激的对应关系,实现利用脑信号对外界视觉刺激进行分类、辨识或重建。本讲习班的举办有利于计算机视觉、人工智能研究者了解人脑视觉皮层高效的信息处理过程和视觉系统感知机制。机器智能和人脑的研究可以相互促进,先进的机器智能有助于探索大脑信息处理的内在神经机制,而大脑的运行机理也将启发新一代类脑智能模型。

02

论坛日程

03

论坛嘉宾

何晖光 报告嘉宾、主持人

中科院自动化所研究员、博士生导师

嘉宾简介:何晖光,中科院自动化所研究员,博导,中国科学院大学岗位教授,上海科技大学特聘教授,中科院青促会优秀会员,建国七十周年纪念章获得者。获得国家科技进步二等奖两项(分别排名第二、第三),北京市科技进步奖两项,教育部科技进步一等奖(排名第三),中科院首届优秀博士论文奖,北京市科技新星,中科院“卢嘉锡青年人才奖”等奖项,其研究领域为人工智能,医学影像分析,脑-机接口等,其研究结果在 IEEE TNNLS/TCYB/TMM/TNSRE, NeuroImage, MedIA, ICML等相国内外核心期刊以及国际主流会议上发表文章 180 余篇。其是《自动化学报》,《中国图象图形学报》等期刊编委。CCF 杰出会员,IEEE 高级会员。

报告题目:基于fMRI的视觉神经信息编解码

报告摘要:基于功能磁共振成像 (fMRI) 等神经影像的视觉神经信息编解码是理解、破译和模拟大脑视觉系统运作机制的重要研究途径,对于类脑智能技术的发展具有重要意义。视觉神经信息编码以大脑视觉感知机制为基础,通过建立大脑视觉信息处理的计算模型来描述大脑对外界刺激的响应过程,以实现对神经活动的预测。研究视觉神经信息编码,对于探索大脑视觉信息加工机制,提高人工视觉模型的感知和认知能力具有重要意义。与此相反,视觉神经信息解码则主要通过分析大脑信号数据,从中找到其与外界视觉刺激的对应关系,实现利用脑信号对外界视觉刺激进行分类、辨识或重建。本报告将介绍人脑视觉系统的基本知识(通路、视网膜拓扑,感受野等),人脑视觉系统和计算机视觉系统的差异,以及基于fMRI的视觉神经信息编解码研究。

杜长德 报告嘉宾、主持人

中科院自动化所助理研究员

嘉宾简介:杜长德,男,中科院自动化所助理研究员。2019年博士毕业于中科院自动化所,从事视觉认知计算领域的研究,在视觉神经信息编解码、多模态神经计算等方面发表了30余篇论文,包括IEEE TNNLS/TMM、Information Fusion、Engineering、AAAI、KDD、IJCAI、MICCAI、ACMMM、UAI等。杜长德博士曾主持包括国家自然科学基金青年基金,中科院特别研究助理资助项目等。担任IEEE TPAMI/TNNLS、ICLR、CVPR、ECCV、AAAI、PRCV等知名期刊和会议的审稿人,中国图象图形学会视觉大数据专委会委员,中国自动化学会模式识别与机器智能专委会委员。多次在国际人脑图谱大会 (OHBM)、国际多媒体大会(ACMMM)、国际人工智能大会(AAAI)做学术报告。曾获得2019年IEEE ICME Best Paper Runner-up Award、2021年AI华人新星百强。关于视觉神经编解码的研究成果被MIT Technology Review头条报道,获得国际大学生类脑计算创新大赛初赛一等奖、决赛三等奖。更多信息请见https://changdedu.github.io/ 。

报告题目:视觉神经信息编解码—算法、数据和应用

报告摘要:本报告在总结基于fMRI的视觉神经信息编解码关键算法进展的基础上,分析现有视觉神经信息编解码方法的局限。在视觉神经信息编码方面,主要介绍基于群体感受野估计的体素编码方法。在视觉神经信息解码方面,按照任务类型将其划分为语义分类、图像辨识和图像重建三个部分,阐述每个部分的代表性研究工作和所用的方法。特别地,在图像重建部分着重介绍基于深度生成模型(主要包括变分自编码器和生成对抗网络)的简单图像、人脸图像和复杂自然图像的重建技术。其次,整理了该领域常用的10个开源数据集,并对数据集的样本规模、被试个数、刺激类型、研究用途及下载地址做了详细归纳。最后,介绍视觉神经信息编解码模型常用的度量指标,分析当前视觉神经信息编码和解码方法的不足,讨论视觉神经编解码方法的应用,并对未来发展方向进行展望。

官方公众号