PRCV

讲习班

Advancing Spatial Intelligence from Data Representation, Learning Process, and 3D Generation

多模态垂域大模型技术与应用

视觉生成合成内容的鉴别与质量评估

一、讲习班简介

随着深度合成、AIGC等技术的发展，视觉内容的合成与生成在视觉质量方面不断演进，并已经跨越“恐怖谷效应”，接近了真假难辨的程度。一方面，可靠地检测合成生成内容对于治理虚假信息和保障网络内容安全具有重大意义；另一方面，合成生成内容的全方位高效评估对于反馈和改进生成质量，促进视觉AIGC高质量发展具有不可替代的意义。

本次讲习班计划从真伪鉴别和质量评估等角度出发，对当前视觉生成与合成内容的发展现状、安全可控、“生成-评估-反馈”闭环等前沿问题进行报告，对生成合成内容的检测与评估的发展现状、关键问题、内在联系、研究趋势等进行介绍。该讲习班预计对视觉合成与生成领域、媒体内容取证与安全领域、视觉质量评估领域的广泛相关研究者具有借鉴和参考价值，对于促进相关领域同行学者的交流和交叉研究具有积极意义。

二、讲习班组织者和讲者信息

组织者1：孙哲南，中国科学院自动化研究所，znsun@nlpr.ia.ac.cn
孙哲南，中国科学院自动化研究所研究员和博士生导师、中国科学院大学人工智能学院岗位教授、天津中科智能识别产业技术研究院院长，1999年在大连理工大学获工业自动化专业学士学位，2002年在华中科技大学获系统工程专业硕士学位，2006年在中国科学院自动化研究所获模式识别与智能系统专业博士学位并留所工作，担任IAPR生物特征识别技术委员会主席（IAPR Fellow）、中国生物识别产业技术创新战略联盟秘书长、中国人工智能学会模式识别专委会副主任、中国图象图形学学会机器视觉专委会副主任和国际期刊IEEE Transactions on Biometrics, Behavior, and Identity Science编委。主要研究方向是生物特征识别、模式识别、计算机视觉。主持和参与国家级科研项目20余项，在国际期刊和会议发表学术论文300余篇，获得发明专利授权50项，获得16项软件著作权，科研成果获得国家技术发明二等奖、国家专利优秀奖和中国图象图形学学会自然科学一等奖，入选国家“万人计划”科技创新领军人才和获得科技部中青年科技创新领军人才，获得中科院卢嘉锡青年人才奖，主持研发的虹膜识别和人脸识别核心技术孵化了三家高科技公司，相关产品在煤矿、银行、安全、手机等领域推广应用。

组织者2：翟广涛，上海交通大学，zhaiguangtao@sjtu.edu.cn
翟广涛，上海交通大学电子信息与电气工程学院教授，IEEE Fellow，国家自然科学基金杰出青年基金获得者，多年从事多媒体智能相关研究，入选Clarivate全球高被引学者，获IEEE多媒体汇刊最佳论文奖等国际奖励20余项。以第一完成人获得中国电子学会自然科学一等奖、技术发明一等奖及中国图象图形学学会技术发明一等奖，主持国家自然科学基金重点、国家重点研发计划等项目。任Elsevier期刊Displays主编、上海市图像图形学学会理事长。

组织者3：赫然，中国科学院自动化研究所，rhe@nlpr.ia.ac.cn
赫然，研究员，IEEE Fellow、IAPR Fellow。主要研究方向是模式识别、生成式人工智能和计算机视觉，并应用到异质图像合成与识别、深度伪造与鉴别。获国家杰出青年科学基金、北京杰出青年科学基金、国家自然联合重点基金、国家重点研发课题和中科院青年促进会优秀会员等项目支持。出版学术专著2部，在权威国际期刊IEEE TPAMI和IJCV上发表论文23篇，第一作者谷歌学术引用过百论文11篇。获IEEE信号处理协会最佳青年论文奖、ICPR最佳科学论文奖、ICB最佳论文提名奖和北京青年优秀科技论文一等奖，以及中国科学院优秀导师(2023/2024)、李佩优秀讲师奖、朱李月华优秀教师奖、中国科学院大学领雁奖等；指导学生获得IEEE生物特征理事会优秀博士论文、北京市优秀博士论文、中国科学院优秀博士论文等。担任IEEE TIP/TIFS/TCSVT/TBIOM、Pattern Recognition和自动化学报等多个国内外期刊编委，NeurIPS/ICML/ICLR/CVPR/ECCV等会议领域主席，ACPR/PRCV/CCBR等会议程序主席。

讲者1：李岳尊，中国海洋大学
李岳尊，本硕毕业于山东大学，博士毕业于美国纽约州立大学奥尔巴尼分校。研究方向包括多媒体取证、深度模型安全和计算机视觉。研究成果发表于 CVPR、ICCV、NeurIPS、ECCV、TIFS、TDSC、TCSVT等多个重要国际期刊和会议，谷歌学术引用8200余次，多篇论文的单篇学术引用超过1300次（最高被引1900余次）, 其中WIFS18的工作曾被CCTV13《世界周刊深度伪造专题》报道。主持国家自然科学青年基金、山东省自然科学青年基金、博士后面上项目和特别资助项目等多个项目。入选2024全球前2%顶尖科学家榜单，获得2024年ACM青岛新星奖。

讲者2：闵雄阔，上海交通大学
闵雄阔，上海交通大学副教授，主要研究多媒体信号处理，主持国家自然科学基金青年B类、面上等项目，入选博新计划，获吴文俊人工智能青年科技奖、电子学会优博、图像图形学会技术发明一等奖、电子学会技术发明一等奖等国内奖励，及IEEE TBC最佳论文奖、IEEE TMM最佳论文提名奖等国际论文奖8项，获CVPR、ECCV等国际挑战赛冠军7项，在IEEE/ACM汇刊与CCF A类期刊/会议上发表论文100余篇，10篇入选ESI热点/高被引，谷歌学术引用1万余次，担任ACM TOMM等期刊编委。

讲者3：李琦，中国科学院自动化研究所
李琦，中国科学院自动化研究所副研究员，中国科学院青促会会员，中国科学院特聘研究骨干，北京市科协青年人才托举。现任中国图象图形学学会生物特征识别专委会（筹）秘书长，北京图象图形学学会理事，中国计算机学会计算机视觉专委会执行委员。近五年发表CCF推荐A类期刊和会议二十多篇, 代表作AnyFace被评选为CVPR最佳论文候选，并入选TPAMI专刊Best of CVPR。撰写Springer专著1部。申请人多次担任国内生物特征识别旗舰会议CCBR出版主席、论坛主席等，担任ICLR 2025、2026的领域主席。主持国家重点研发计划青年科学家项目一项，科技创新2030“新一代人工智能”重大项目课题一项，国家自然科学基金两项。研究成果获2022年中国图象图形学学会技术发明奖二等奖、2023年中国产学研合作创新成果二等奖等。

讲者4：彭勃，中国科学院自动化研究所
彭勃，博士，副研究员， 2018 年至今在中科院自动化所工作。在图像内容取证与安全、深度伪造对抗与攻防、AIGC合成与治理等领域有丰富的研究经验。主持科技创新2030— 新一代人工智能重大项目课题、国家自然科学基金面上项目、中国科协青年托举项目、北京市自然科学基金面上项目、华为MindSpore学术奖励基金等十余项。在 IEEE TPAMI、TIFS、TCSVT、TMM、CVIU、CVPR、 AAAI、ACM MM等重要国际期刊和会议上发表论文50余篇，获发明专利授权19项，曾获中国发明协会发明创业奖创新奖一等奖、中国图象图形学学会技术发明奖二等奖等奖项和荣誉。目前是中国图像图形学会数字媒体取证与安全专委会委员、生物特征识别专委会委员、北京图象图形学会青工委委员、IEEE Beijing Biometrics Council Chapter Secretary。

三、讲习班课程大纲

题目	内容	主讲人	时间

视觉鉴伪技术研究新进展	报告聚焦图像和视频层面的视觉鉴伪技术，介绍相关研究新进展，并探讨当前面临的主要挑战。	李岳尊	25~30 min

生成式内容质量评价研究	报告生成式内容评估，包括图像、视频、音视频生成以及图像视频编辑等方面的质量评价研究最新进展，以及后续发展方向。	闵雄阔	25~30 min

换脸结果评估研究	系统性总结现有换脸算法的主要类别，并深入分析当前换脸结果评测方法存在的不足。进一步提出并构建一个新型 benchmark，用于全面、客观地评估不同换脸算法的性能。	李琦	25~30 min

生成合成人像的鉴别与评估研究进展	报告人像深度合成及AIGC内容的鉴别、视觉质量评估、两者内在联系与区别等方面的最新研究进展及趋势分析。	彭勃	25~30 min

四、参考文献

[1] Xinjie Cui, Yuezun Li, Ao Luo, Jiaran Zhou, Junyu Dong, "Forensics Adapter: Adapting CLIP for Generalizable Face Forgery Detection",IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025.
[2] Shuaiwei Yuan, Junyu Dong, Yuezun Li, "Where the Devil Hides: Deepfake Detectors Can No Longer Be Trusted"，IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2025.
[3] Yunfei Li, Yuezun Li, Xin Wang, Baoyuan Wu, Jiaran Zhou, Junyu Dong. "Texture, Shape and Order Matter: A New Transformer Design for Sequential DeepFake Detection",IEEE Winter Conference on Applications of Computer Vision (WACV), 2025.
[4] Delong Zhu, Yuezun Li, Baoyuan Wu, Jiaran Zhou, Zhibo Wang, Siwei Lyu, "Hiding Faces in Plain Sight: Defending DeepFakes by Disrupting Face Detection",IEEE Transactions On Dependable And Secure Computing (TDSC), 2025
[5] Hanzhe Li, Jiaran Zhou, Yuezun Li, Baoyuan Wu, Bin Li, Junyu Dong. "FreqBlender: Enhancing DeepFake Detection by Blending Frequency Knowledge", The Annual Conference on Neural Information Processing Systems (NeurIPS), 2024.
[6] Qingxuan Lv, Yuezun Li, Junyu Dong, Sheng Chen, Hui Yu, Huiyu Zhou, Shu Zhang, "DomainForensics: Exposing Face Forgery across Domains via Bi-directional Adaptation", IEEE Transactions on Information Forensics and Security (TIFS), 2024.
[7] Jiarui Wang, Huiyu Duan, Guangtao Zhai, Juntong Wang, Xiongkuo Min, “AIGV-assessor: benchmarking and evaluating the perceptual quality of text-to-video generation with LMM，” CVPR, 2025.
[8] Jiarui Wang, Huiyu Duan, Yu Zhao, Juntong Wang, Guangtao Zhai, Xiongkuo Min, “LMM4LMM: Benchmarking and Evaluating Large-multimodal Image Generation with LMMs，” ICCV, 2025.
[9] Yuqin Cao, Xiongkuo Min, Yixuan Gao, Wei Sun, Guangtao Zhai, “AGAV-rater: adapting large multimodal model for AI-generated audio-visual quality assessment，” ICML, 2025.
[10] Jiaying Qian, Ziheng Jia, Zicheng Zhang, Zeyu Zhang, Guangtao Zhai, Xiongkuo Min, “Towards Explainable Partial-AIGC Image Quality Assessment，” ACM MM, 2025.
[11] Qi Li, Weining Wang, Chengzhong Xu, Zhenan Sun, Ming-Hsuan Yang," Learning Disentangled Representation for One-Shot Progressive Face Swapping", IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI), 2024.
[12] Weinan Guan, Wei Wang, Bo Peng, Ziwen He, Jing Dong, Haonan Cheng, "Noise-Informed Diffusion-Generated Image Detection with Anomaly Attention", IEEE Transactions on Information Forensics & Security (TIFS), 2025.
[13] Zichuan Wang, Bo Peng, Songlin Yang, Zhenchen Tang, Jing Dong, “HandEval: Taking the First Step Towards Hand Quality Assessment in Generated Images”, in submission.
[14] Bo Peng, Zichuan Wang, Sheng Yu, Xiaochuan Jin, Wei Wang, Jing Dong, “DREAM: A Benchmark Study for Deepfake REalism AssessMent”, In submission.
[15] Shuhao Han, Haotian Fan, Fangyuan Kong, et al., "NTIRE 2025 challenge on Text to Image Generation Model Quality Assessment", NTIRE Workshop and Challenges @ CVPR 2025.
[16] Chen Yang, Bo Peng, Jing Dong, Xiaoyu Zhang, "Unveiling Deepfakes with Latent Diffusion Counterfactual Explanations", IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2025.
[17] Bo Peng, Xianyun Sun, Caiyong Wang, Wei Wang, Jing Dong, Zhenan Sun, et al., "DFGC-VRA: DeepFake Game Competition on Visual Realism Assessment", 2023 IEEE International Joint Conference on Biometrics (IJCB).

主办单位

中国图象图形学学会 (CSIG)

中国人工智能学会 (CAAI)

中国计算机学会 (CCF)

中国自动化学会 (CAA)

承办单位

上海交通大学 (SJTU)

上海飞腾文化传播有限公司

协办单位

AutoDL

华东师范大学

官方微信公众号