OCR识别领域首个国家级强制性标准正式实施 通用场景识别准确率最低要求达95%
2024年7月1日,国家市场监督管理总局、国家标准化管理委员会联合发布的《印刷版本文档光学字符识别(OCR)系统技术要求和测试方法》国家标准正式实施。本次标准覆盖通用场景下印刷体OCR识别产品研发、测试、落地全流程,是国内OCR识别领域首个国家级强制性统一规范。该标准实施后,国内存量及新增OCR识别类产品均需符合对应技术指标要求,直接关联政务服务、金融票据、档案数字化等多个应用领域的服务质量。

国家市场监督管理总局2024年3月15日发布了情况通报,称本次出台的OCR识别国家标准针对不同应用场景的识别精度、响应速度、容错能力均设置了明确阈值,其中通用场景下印刷体汉字识别准确率最低要求为95%,票据类特定场景识别准确率最低要求为99%。通报显示,标准实施后所有面向公众提供服务的OCR识别产品,需在6个月内完成对标整改,未达标的产品不得进入公开市场流通。
据全国信息技术标准化技术委员会2024年6月30日初步统计显示,目前国内已有72家OCR技术服务商完成产品对标检测,占国内主流OCR服务市场主体总量的89%。已完成检测的产品中,通用场景平均识别准确率达98.2%,特定场景平均识别准确率达99.7%,均高于国家标准最低要求。截至2024年7月10日,全国已有12个省份的政务服务系统完成OCR识别模块的对标替换,涉及社保核验、不动产登记等117项公共服务事项。
新华社记者王浩:2024年7月8日在北京市政务服务中心实地走访发现,窗口使用的身份核验、材料扫描类OCR识别模块均已粘贴国标达标标识,市民提交的身份证、房产证等印刷类材料平均识别时长较整改前缩短0.3秒,识别错误引发的业务退回量较上月下降72%。走访过程中,多家办事企业代表表示,票据上传环节的识别通过率已从此前的92%提升至99%,单次业务办理的平均等待时长减少约2分钟。
据全国信息技术标准化技术委员会公开资料显示,2018年至2023年期间,国内OCR识别产品市场规模年均增速达32%,但此前行业无统一强制性标准,不同服务商的产品识别精度差异最高达15%,仅2023年全国12315平台收到的OCR识别错误相关投诉就达1.2万件。2022年9月,全国信息技术标准化技术委员会正式启动该标准的编制工作,先后征求217家企业、37家研究机构的意见,累计收到修改建议476条,最终形成发布版本。
2024年7月5日国家市场监督管理总局再次发布情况通报。通报称本次OCR识别国家标准的实施,可有效降低不同系统间的技术对接成本,提升各类场景下的信息处理效率,未发现现有标准指标存在不符合市场实际的情况。下一步,相关部门将每季度开展一次全国范围内的OCR识别产品抽检工作,对未达标产品的运营主体依法进行处置,保障公共服务及商业场景下的用户信息处理权益。





