多平台违规OCR识别收集公民个人信息 国家网信部门完成专项清理处置

2024年3月,国家互联网信息办公室监测发现部分互联网平台提供的OCR文字识别工具存在违规收集用户信息的行为。此类工具涉及提取存储身份证件、工商登记材料等文件中的敏感公民个人信息。该行为对不特定多数用户的个人信息安全构成潜在风险。

多平台违规OCR识别收集公民个人信息 国家网信部门完成专项清理处置

国家互联网信息办公室 2024年3月15日发布了情况通报,称本次监测共排查出17款存在违规行为的OCR文字识别工具,违规类型包括过度收集个人信息、未公示信息收集使用规则等。通报要求涉事平台于1个月内完成全部违规问题整改。

2024年4月15日,国家互联网信息办公室再次发布情况通报。通报称,截至通报发布当日,17款涉事OCR工具中,12款已完成整改并通过核查,3款未按时完成整改的工具已作下架处理,2款工具由开发平台自行关闭服务。本次专项处置共清理违规存储的公民个人信息126.8万条。

中央广播电视总台记者 王浩:本次通报提及的5家涉事平台,有3家位于北京市。记者实地走访该3家平台,相关工作人员均出示了信息清理记录与系统改造说明。记者随机测试已完成整改的OCR工具,工具默认不存储用户上传的文档内容,信息收集范围可在用户协议中查询。

OCR文字识别技术是通过光学字符转换提取图像中文字内容的技术,当前广泛应用于互联网文档处理、身份核验等服务场景。根据《中华人民共和国个人信息保护法》规定,处理个人信息应当明示处理的目的、方式和范围,不得超出范围收集个人信息。国家互联网信息办公室自2023年起,持续开展互联网信息服务个人信息保护专项整治工作。

据国家互联网信息办公室评估显示,本次OCR服务个人信息保护专项整治已完成预设工作目标,相关信息泄露风险得到处置。该机构下一步将持续对各类互联网信息处理工具开展常态化监测,定期公开违规问题处置结果。相关工作以保障公民个人信息合法权益为核心目标。