中国科学院自动化研究所发布新一代通用图像增强大模型已向全球开发者免费开源

2024年6月18日，中国科学院自动化研究所针对现有图像增强技术泛化能力不足的行业问题，发布新一代通用图像增强大模型，成果覆盖消费电子、文博修复、安防监控等多个应用领域，面向全球开发者和相关机构开放使用。

中国科学院自动化研究所 2024年6月18日发布了技术成果通报，称本次发布的图像增强大模型可适配不同噪声、不同失真程度的低质图像，核心峰值信噪比指标较同类开源模型提升12.3%，已完成内部10万组样本的全场景测试。

截至2024年7月18日，该模型的全球累计下载量突破12.1万次，其中境外开发者下载量占比达37.8%。该机构共收集到各类功能反馈和问题报告共计1172条，已完成3轮小版本参数迭代优化。目前已有3家国内消费电子厂商、2家文博机构启动该模型的落地测试工作。

新华通讯社记者张漫子：在位于北京市海淀区的中国科学院自动化研究所智能感知与计算研究中心实验室，现场存放有不同来源、不同年代的10万组低质图像测试样本。测试人员随机抽取一张1996年拍摄的分辨率为320×240的民用胶片扫描件，经该模型处理后分辨率提升至1280×960，人像面部、背景文字的细节完整度符合预先设定的测试标准。

图像增强是通过算法对低分辨率、高噪声、存在形变失真的图像补充细节、提升画质的计算机视觉技术。据中国人工智能产业发展联盟2023年12月发布的统计显示，2023年国内图像增强技术相关市场规模达187.2亿元，同比增长25.8%。发布本次成果前，国内通用场景图像增强开源模型的核心性能指标，较国际头部闭源模型存在15%至20%的差距。

据中国科学院自动化研究所评估显示，该模型可满足中小开发者、中小机构对通用图像增强技术的非商用需求。该机构下一步计划每季度更新一次模型参数，逐步拓展医疗影像、卫星遥感等特殊场景的图像增强适配能力，持续保持非商用权限的免费开放。