主题介绍
随着大模型时代的到来,人工智能在医疗领域的创新应用不断突破,正在深刻改变诊疗流程与医学科研范式。从多模态医学大模型的构建到智能手术导航、从肿瘤影像识别到基层诊疗赋能,AI正以前所未有的深度融入临床一线。然而,目前医学人工智能仍面临诸多挑战,如高质量标注数据匮乏、模型泛化能力有限、临床真实场景下的应用落地仍存在较大鸿沟。本论坛以“大模型时代的智慧医学诊疗”为主题,聚焦医学与人工智能的交叉前沿,汇聚来自高校、科研机构、医疗机构及产业界的专家学者,围绕人工智能在影像分析、临床辅助决策、手术机器人、基层健康服务等关键场景中的创新实践与技术挑战,展开深入交流与探讨。论坛旨在推动大模型时代下人工智能与医疗健康深度融合,助力建设更加精准、高效、智能的诊疗体系,服务“健康中国”国家战略。论坛将邀请多位在计算机视觉、医学图像处理、临床AI应用等领域具有深厚影响力的专家进行主题报告,分享最新研究成果与实践经验,共同探讨医学大模型的未来发展之路。
在人际交往中,准确理解他人情感与意图是有效沟通的基础,尤其在公共安全等高对抗性场景中,识别欺骗与真实意图至关重要。随着人工智能尤其是计算机视觉的发展,通过分析微表情、肢体语言等多模态数据来解析人类心理状态的情感计算技术,正从理论走向应用,展现出巨大潜力。然而,该领域仍面临核心挑战:如何在复杂情境下使AI超越简单模式匹配,实现对真实意图的深度洞察?这亟需加强基础理论与计算技术的融合。本次论坛旨在搭建跨学科平台,汇聚计算机、公共安全等领域专家,共同探讨情感与行为计算的前沿进展,分享其在刑事侦查、人机交互等领域的应用成果,展望未来趋势,以推动情感计算关键技术在实际场景中的转化,为构建更智能、安全的社会贡献力量。
专题论坛组织者的姓名、所属机构以及联系信息
姓名 | 所属机构 | 联系信息 |
---|---|---|
史淼晶 | 同济大学 | mshi@tongji.edu.cn |
王甦菁 | 中国科学院心理研究所 | wangsujing@psych.ac.cn |
罗勇 | 武汉大学 | zxh@fudan.edu.cn |
李婧婷 | 中国科学院心理研究所 | lijt@psych.ac.cn |
陈浩 | 香港科技大学 | jhc@cse.ust.hk |
钱大宏 | 上海交通大学 | dahong.qian@sjtu.edu.cn |
各报告的日程安排、详细报告信息与讲者信息(含拟邀请讲者的个人简介及报告题目
时间:2025年10月16日
地点:中国.上海.国际会展中心.分会场
时间 | 报告嘉宾 | 报告题目 |
---|---|---|
13:30 - 14:00 | 梁荣华 教授 浙江科技大学 |
多模态图像数据的智能感知技术及医学应用 |
14:00 - 14:20 | 刘浩 研究员 中国科学院沈阳自动化研究所 |
柔性手术机器人的增强感知与智能导航技术 |
14:20 - 14:40 | 王亚奇 副教授 杭州电子科技大学 |
AI赋能口腔数字化诊疗 |
14:40 - 15:00 | 胡瑞敏 教授 西安电子科技大学 |
基于行为模式分析的无感欺骗行为检测 |
15:00 - 15:20 | 王上飞 教授 中国科学技术大学 |
情感交互机器人 |
15:20 - 15:40 | 刘峰 助理研究员 上海交通大学 |
Dynamic Facial Emotion Recognition |
史淼晶,国家级高层次青年人才,同济大学电子与信息工程学院教授、科学技术研究院副院长(青干),自主智能无人系统全国重点实验室骨干成员,伦敦国王学院客座教授。博士毕业于北京大学,历任法国国家信息与自动化研究院研究员,英国伦敦国王学院信息系助理教授,副教授。主要研究计算机视觉,医学图像处理等,先后在IEEE TPAMI、IJCV、 Proceedings of IEEE、CVPR、ICCV、NeurIPS等发表高水平期刊会议论文90余篇;主持中国自然科学基金项目,英国工程与自然科学研究理事会项目,欧洲研究理事会项目等10余项。近期获法中委员会个人科技创新奖,伦敦国王学院年度贡献奖,同济大学五四青年奖章。他是英国高等教育学会会士,IEEE高级会员。
电子邮箱:mshi@tongji.edu.cn
王甦菁博士,中国科学院心理研究所青年特聘研究员,博士生导师。2012年6月博士毕业于吉林大学计算机科学与技术学院,2012年8月至2015年6月在中国科学院心理研究所做博士后工作。2015年7月加入中国科学院心理研究所。主要研究方向为模式识别与机器学习,特别是微表情识别。在国内外重要期刊和学术会议上发表八十余篇论文,包括TPAMI、TAC、TIP、TNN、ECCV等,多篇论文进入ESI高被引论文清单。IEEE TAC、Neurocomputing期刊Associate Editor。CCF 理事,IEEE高级会员,CCF计算机视觉专业委员会委员,CCF计算机人机交互专业委员会常务委员,中国人工智能学会人工心理与人工情感专业委员会委员,中国图象图形学学会机器视觉专业委员会委员,中国图象图形学学会情感计算与理解专业委员会常务委员,残疾人事业发展研究会理事,中国残疾人康复协会康复工程与辅助技术专业委员会副秘书长,广西安琪之家康复研究中心(脑瘫网络理事长机构)理事。主持国家自然科学基金面上项目3项,北京市自然科学基金面上项目1项,中国博士后基金2项。获2018年第八届吴文俊人工智能科学技术奖一等奖、2022年度江西医学科技奖二等奖、2023年度北京市科学技术奖自然科学奖二等奖。连续六年(2019-2024年)入选斯坦福全球前2%顶尖科学家榜单。被新华社称为“中国版霍金”,担任北京2022年冬残奥会火炬手,被评为第七届全国自强模范。
电子邮箱:wangsujing@psych.ac.cn
罗勇,国家高层次青年人才,武汉大学计算机学院教授、博士生导师,长期从事机器学习理论与方法及在多媒体、医学影像分析应用等方向的研究,发表Nature子刊、IEEE TPAMI等100余篇高水平论文。获中国计算机学会(CCF)优秀博士学位论文奖,2017年人工智能会议IJCAI杰出论文提名(2540选3)和IEEE GlobeCom 2016最佳论文奖。指导学生获IEEE MMSP 2022最佳学生论文奖,并与他的合作者获IEEE TMM 2023、IEEE ICME 2019和IEEE VCIP 2019最佳论文奖。主持国家自然科学基金区域联合基金(重点)和面上项目。担任SCI一区期刊IEEE TMM编委,CCF A类会议NeurIPS、ACM MM领域主席。
电子邮箱:luoyong@whu.edu.cn
李婧婷,中国科学院心理研究所副研究员,博士生导师。获聘中国科学院心理研究所特聘骨干岗位,入选2023年中国科学院青年创新促进会成员。主持国家自然面上、青基等科研项目,于IEEE TPAMI、TAC、TIP、ICCV、ACMMM等国内外期刊、会议发表微表情相关论文多篇,两篇论文进入ESI高被引论文清单。相关研究成果获2023年北京市科学技术奖自然科学奖二等奖。连续四年担任ACMMM 微表情国际挑战赛主席,担任PRL等期刊客座编委、TPAMI、TAC、TIP、TCSVT、Neurocomputing等期刊审稿人。主要研究方向包括计算机视觉、情感计算,特别是智能人脸微表情分析。
电子邮箱:lijt@psych.ac.cn
陈浩,香港科技大学计算机科学与工程系,化学与生物工程系和生命科学部助理教授,医工交叉联合创新中心主任,研究兴趣包括大模型医疗,计算病理,多模态数据融合,医学图像分析,计算机辅助微无创诊疗等。在Nature Biomedical Engineering、Nature Communications、Lancet Digital Health、Nature Machine Intelligence、Jama、MICCAI、IEEE-TMI、MIA、CVPR、ICCV等顶级期刊和会议发表论文100余篇(谷歌学术引用34500余次,h-index 77),连续入选斯坦福大学全球排名前2%科学家名单,科睿唯安全球高被引科学家等。曾获得2023年亚洲青年科学家、国家教育部优秀成果二等奖、北京市科技进步一等奖、2019年人工智能医学影像顶级会议MICCAI青年科学家影响力奖等奖项,担任包括IEEE TMI、TNNLS、J-BHI和CMIG等期刊编委,担任ICLR、CVPR、ACM MM、MICCAI等多个国际会议的领域主席,曾带领团队获得15项国际医学图像分析的挑战赛冠军。
电子邮箱:jhc@cse.ust.hk
钱大宏,上海交通大学生物医学工程学院长聘教授、博士生导师,先进医疗芯片研究所所长;上海交通大学中银科技金融学院双聘教授。主要研究方向是医疗电子芯片以及人工智能在医学领域的应用,并在人工智能辅助诊疗研究的基础上开展各种医疗机器人关键技术的研究。发表SCI论文100多篇,并且转化了多个产品。在上海交通大学生物医学工程学院和上海交通大学医学院分别开设并主讲《智能创新医疗设计BioDesign》和《人工智能与医学》课程。2023年和2025年分别主编出版了《医疗科技创新与创业》和《人工智能的医学应用》。
电子邮箱:dahong.qian@sjtu.edu.cn
多模态图像数据的智能感知技术及医学应用
图像感知是实现机器智能化的核心课题之一,通过本团队承担的国家自然科学基金重大仪器等项目,介绍本团队在光学和声学等多模态图像数据的感知技术方面取得的研究成果及其医学应用,阐明光学、声学、计算机科学、人工智能、医学等跨学科交叉与融合在推进该领域的重要作用。
梁荣华,男,浙江科技大学副校长,教授、博导。入选第三批国家万人计划科技创新领军人才、科技部中青年科技创新领军人才、教育部新世纪优秀人才、浙江省有突出贡献的中青年专家等,享受国务院政府特殊津贴。主要从事多模态数据的感知与理解等领域的研究工作,先后主持国家重点研发计划项目、国家自然基金重大仪器和国家自然基金重点项目等20余项;相关成果在IEEE TPAMI、TVCG、TIP、TKDE、AAAI等期刊和会议发表学术论文150多篇;以第一完成人获浙江省自然科学一等奖、浙江省科技进步一等奖、中国专利优秀奖等奖励;任“智能感知与系统”教育部工程中心负责人,任国际期刊IEEE Trans. Cognitive and Developmental Systems 等编委。
电子邮箱:rhliang@zjut.edu.cn
报告时间:13:30 - 14:00
柔性手术机器人的增强感知与智能导航技术
人体腔道曲折复杂、空间受限,既是重大及多发疾病的发病位置,亦是实施诊断和治疗的必经之路。柔性手术机器人具有优良的环境顺应性和灵巧的作业能力,是人体腔道内作业的重要使能技术,在世界范围内得到广泛研究和应用。但是现有技术面对复杂腔道环境及手术任务的综合效能仍然非常有限,而且手术机器人未来必然朝向智能化的方向发展,为临床提供更精准和更加易于实施的手术方案。报告将对柔性手术机器人技术的发展现状进行概述,并介绍报告人在柔性手术机器人方向关键技术的研究以及面向重大疑难疾病救治以及应急救援方向的应用情况。
刘浩,中国科学院沈阳自动化研究所研究员,博士生导师。于哈尔滨工业大学取得本、硕、博士学位,2014年访学美国约翰霍普金斯大学。担任中国医学装备协会人工智能和医用机器人工作委员会常委、辽宁省微创手术机器人重点实验室主任。入选中国科学院创新交叉团队负责人和辽宁领军人才等。长期从事医疗手术机器人与应急救援研究,多项成果进入临床试验与应用阶段。主持国家重点研发计划项目、国家自然基金联合重点项目、中央军委后保部重点项目等20余项国家及省部级课题。以一作及通讯作者发表学术论文105篇,包括IJRR,IEEE/ASME T-MECH,IEEE T-IE等高水平国际期刊,授权发明专利40项,美国专利2项。获得第二届全国创新争先奖、国家科技进步二等奖、中国自动化学会技术发明一等奖等。成果入选2021年中国智能制造十大科技进展,获评辽宁省五一劳动奖章等。
电子邮箱:liuhao@sia.cn
报告时间:14:00 - 14:20
AI赋能口腔数字化诊疗
聚焦AI技术驱动口腔诊疗向精准化、智能化转型的实践与突破,系统梳理团队在口腔诊疗全流程的技术研发与临床应用成果。影像处理层面,攻克去金属伪影、二维/三维影像分割关键技术,实现牙齿、牙槽骨等解剖结构精准提取;疾病诊断环节,基于深度学习构建龋齿等疾病智能诊断模型,提升早期识别效率与准确率。创新引入多模态大模型,实现口腔报告及个性化手术方案自动生成;治疗领域,研发根管治疗智能化辅助系统,开展口腔三维匹配技术研究,并融合AI与手术机器人,研发自动种植、智能正畸系统。成果覆盖诊疗全链条,为口腔医疗智能化发展及AI规模化应用提供实践支撑。
王亚奇,杭州电子科技大学副教授,电子科学技术博士英国伦敦玛丽女王大学访问学者,杭州市人工智能学会副秘书长。从事医疗影像AI与临床交叉领域研究十年,与浙二眼科、华西口腔、杭州牙科集团、上海九院、复旦口腔等合作,亦研究AI电影修复、AI短剧和AI芯片等应用方向。发表SCI和EI论文60余篇,引用2千余次,获专利13项、软著7项,任领域SCI期刊副主编和审稿人。牵头举办三年国际挑战赛STS(2023-2025)和参与发布MICCAI和CVPR医学多模态大模型挑战赛,联合举办MICCAI 2025 ODIN Workshop;指导团队获亚太眼科学会竞赛第2名和EDA挑战赛第1名等荣誉。主持国家青年基金,参与国家重点研发计划和省重点项目。
电子邮箱:43192@hdu.edu.cn
报告时间:14:20 - 14:40
基于行为模式分析的无感欺骗行为检测
数字时代虚假信息泛滥,司法、安防等领域亟需无感测谎技术。《中国法院网》呼吁智能辅助,国际实践如美国SPOT计划、英国行为侦察队印证其价值。2025年中国测谎市场将达60亿元,急需高精度无感测谎技术方案。
当前研究面临三大核心问题:
1)理论争议:主流面部中心论导致37%信息丢失;
2)研究空白:缺乏头部-肢体时空关联建模;
3)技术缺陷:像素驱动注意力浪费50%资源,模态融合降低34.4%肢体线索学习率。
我们构建了身体关系感知模型,联合建模头部-肢体交互关系,提升精度14.1%;采用语义驱动建模,聚焦欺骗敏感区域,提升精度7.92%;引入DALS动态评估策略,实现多线索均衡学习,提升准确率6.46%。
研究取得两项原创突破:1)验证欺骗行为通过时空协调失衡外显;2)创立关系感知+动态平衡学习新范式。成果为无感测谎系统提供理论基础,推动测谎行业智能化升级。
胡瑞敏教授,国务院政府特殊津贴获得者、科技部网络空间安全2030计划专家组成员、教育部信息技术新工科联盟网络空间安全工委会主任、公安部特聘专家,曾获第七届中国青年科技奖、第五届中国青年科技创新奖,教育部、公安部、中国电子学会、湖北省、广东省科技进步奖等多项奖项,主持国家重大科技专项、重点研发计划项目和五项国家自然科学基金重点项目。曾担任武汉大学计算机学院院长、国家网络空间安全学院执行院长、国家多媒体软件工程技术研究中心主任、西安电子科技大学网络与信息安全学院院长、海康威视公司研究院院长、美亚柏科公司研究所首席科学家、TCL集团科技顾问。主要从事多媒体大数据社会安全行为理解与智能服务关键技术与系统研究,重点研究可信身份、复杂关系、隐秘组织、行为模式等关键技术,研制的技术与产品广泛应用于国内外信息服务行业。
情感交互机器人
随着机器人技术的蓬勃发展,人和机器人之间的交互正逐渐从物理性的、 功能性的交互向社会辅助性的交互发展。正如情感交互是人类交流的重要环节,对用户情感状态的感知、干预,以及机器人的情感表达也是人和服务型机器人自然交互中不可或缺的重要环节。本报告将介绍我们在情感感知、情感表达和情感干预方面的工作。
王上飞教授,博士毕业于中国科学技术大大学,博士后工作于日本九州大学,曾赴美国伦斯勒理工学院访学。现为中国科学技术大学计算机科学与技术学院教授、博士生导师。她长期从事情感计算、计算机视觉和机器人研究,在国内外重要学术期刊和学术会议上发表论文百余篇。发表的论文成为IEEE Trans. 热点论文百余次。担任IEEE TAC和ACM TOMM副主编、ACMMM 2024和ACMMM2025领域主席、安徽省人工智能学会情感计算专业委员会主任委员。指导的研究生获得GOOGLE女性科学家奖、GOOGLE奖学金、中科院院长奖、国家奖学金和优秀毕业生等多个奖项。
Dynamic Facial Emotion Recognition
本次报告聚焦动态面部表情识别DFER的技术发展与发展理念。我们关注到传统的静态表情难以刻画表情在时空上的动态演化;现有一部分基于视频的表情识别技术中仅有整段视频级别的标签,并且夹杂大量非目标帧,关键变化多发生于短片段且长时两端同类表情之间的相关性弱,亟需新的弱监督范式。基于此,本报告首先提出一种新的动态表情识别范式M3DFEL,该范式基于3D实例级MIL来定位关键信息,并结合长时聚合与时序一致性正则,协同建模短-长时依赖,在DFER领域内取得了领先表现;在此基础上,进一步提升了该范式的鲁棒性,提出RDFER架构,即利用“标签一致性”特性来区分“困难样本/噪声样本”,配合关键表情重采样与双流分层网络,对冗杂信息“做减法”,显著提升了鲁棒性与准确率。最后,还考虑了引入了肌肉动作单元(AU)先验知识,对用于判别线索的特征信息“做加法”,进而进一步提升其可解释性。报告的最后还展望了未来,希望达到宏观表情与微表情动态面部识别在时空维度上的大统一,增强DFER的跨域泛化能力与应用价值。
刘峰博士,目前任职于上海交通大学心理学院助理研究员,硕士生导师,上海纽约大学访问学者。中国计算机学会高级会员、中文信息学会情感计算专委。担任BME Frontiers (spj)、Brain-X、CAAI AIR认知与情感计算、Applied Sciences期刊的青年编委。以通讯或一作在IEEE/CVF CVPR、IEEE T-AFFC、IEEE T-BIOM、IEEE T-CSS等国际会议或期刊发表论文60余篇。主要研究兴趣在情感计算、可计算量化情感、计算心理学/精神病学等计算机与心理学交叉学科方向。
中国图象图形学学会 (CSIG)
中国人工智能学会 (CAAI)
中国计算机学会 (CCF)
中国自动化学会 (CAA)
上海交通大学 (SJTU)
上海飞腾文化传播有限公司
AutoDL
华东师范大学