说明:最全电力标准
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
ICS 01. 140.20 A 14 DA 中华人民共和国档案行业标准 DA/T 77—2019 纸质档案数字复制件光学字符 识别(OCR)工作规范 Specification for optical character recognition (OCR) of digital copies of paper-based records 行业标准信息服务平台 2019-12-16发布 2020-05-01实施 国家档案局 发布 DA/T77—2019 前言 本标准按照GB/T1.1一2009给出的规则起草。 本标准由国家档案局提出并归口。 本标准起草单位:国家档案局馆室司、青岛市档案馆。 本标准主要起草人:刘芸、丁德胜、杨来青、邹杰 行业标准信息服务平台 2 DA/T 77—2019 纸质档案数字复制件光学字符 识别(OCR)工作规范 1范围 本标准规定了纸质档案数字复制件光学字符识别(OCR)工作的组织、实施和管理。 本标准适用于字迹清晰、文本规范的纸质档案数字复制件的光学字符识别(OCR)工作。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 DA/T13档号编制规则 DA/T22归档文件整理规则 DA/T31 纸质档案数字化规范 3术语和定义 下列术语和定义适用于本文件。 3.1 字符character 供组织、控制或表示数据用的元素集合中的一个元素。 [GB18030—2005,定义4.1] 3.2 字符集 character set 多个字符的集合。 注:常见字符集有ASCII字符集、GB2312字符集,BIG5字符集、GB18030字符集、Unicode字符集等。 3.3 光学字符识别 optical character recognition;OCR 通过信息技术对图像文件中的字符形状进行识别、文字转换和文本输出、呈现的过程。 3.4 纸质档案数字复制件digitalcopyofpaper-basedrecord 纸质档案经过数字化加工过程后形成的,存储在磁带、磁盘、光盘等载体上并能被计算机等电子设 备识别的数字图像。 3.5 档案OCR成果OCRoutcomeofrecord 记录通过OCR技术获取的纸质档案数字复制件文字内容的文件。 3 DA/T77—2019 3. 6 识别准确率recognitionaccuracy 通过OCR技术识别正确字符的比率 注:识别准确率=(识别正确字符数/应识别字符总数)X100% 3.7 识别速度recognition speed 单位时间内通过OCR技术识别字符的数量。 4总则 4.1档案OCR应纳入数字档案馆(室)资源建设范畴,统筹规划、有序实施,逐步实现常态化 4.2档案OCR应科学开展,有利于实现档案信息检索和计算机辅助编目、编研开发数据挖掘 的关联关系。 4.4应当来取有效的管理和技术手段,加强档案OCR的过程管理和质量控制,确保档案OCR过程规 范、成果可靠、数据安全、 4.5涉密纸质档案数字复制件的OCR工作,应符合涉密档案相关的管理和技术要求。 5工作组织 5.1机构及人员 5.1.1应建立档案OCR工作机构,配备相应素质和技术水平的工作人员,组织开展档案OCR工作的 统筹规划、组织实施、协调管理、技术保障、安全保障、监督检查、成果验收和长期保存等。档案OCR可 与纸质档案数字化工作统筹配置工作机构和人员, 5.1.2档案OCR工作实行服务外包的,应从企业性质、股东组成、安全保密、企业规模、注册资金情况 等方面严格审查档案OCR服务供方的相关资质;从规章制度的建立健全程度等方面考查服务供方的 管理能力,建立权责明确、覆盖工作全过程的监督机制和安全防范机制,确保档案信息安全。对外聘的 工作人员,应进行安全审查,按规定进行保密教育 5.2流程控制 5.2.1档案OCR流程包括图像导入、图像预处理、比对识别、修改校正、成果整理输出五个业务环节。 应依据相关技术标准,对档案OCR全过程进行有效控制。 5.2.2应加强对档案OCR工作全流程的质量管理和安全管理,建立完善的质量、安全问题发现、修正 机制,确保OCR成果质量和档案信息安全。 5.3工作文件与元数据 5.3.1应建立档案OCR工作方案、技术方案、工作审批材料、流程控制材料、数据验收材料、项目验收 报告、成果移交材料等的管理工作文件,采取服务外包的还应包括项目招标文件、投标文件、中标通知 书、项目合同、保密协议、操作规程、监管记录等,以加强对档案OCR工作的管理 5.3.2应参照相关标准,提出档案OCR工作流程中相关元数据设计、捕获、著录和管理的基本要求, 4
DA-T 77—2019 纸质档案数字复制件光学字符识别(OCR)工作规范
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2.5元下载(无需注册)
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2.5元下载
本文档由 SC 于
2023-03-15 12:25:31
上传分享
举报
下载
原文档
(1.7 MB)
分享
友情链接
GB-T 25861-2023 蒸气压缩循环水源高温热泵机组.pdf
T-GHDQ 114—2022 车载CAN网络入侵检测和态势感知技术要求.pdf
GB-T 31853-2015 矢量无负压供水设备.pdf
GB-T 22739-2008 地理标志产品 建莲.pdf
GB-T 39600-2021 人造板及其制品甲醛释放量分级.pdf
DB11-T 2163-2023 固定资产投资项目节能审查事中评价规范 北京市.pdf
GA-T 1794-2021 公安视频会议室技术规范.pdf
GB-T 22939.6-2008 家用和类似用途电器包装 电冰箱的特殊要求.pdf
DB44-T 1212-2013 用能单位能源计量管理体系通用要求 广东省.pdf
GB-T 21082.4-2007 银行业务 密钥管理(零售) 第4部分 使用公开密钥密码的密钥管理技术.pdf
关于加强党政部门云计算服务网络安全管理的意见 .pdf
GB-T 28997-2012 舞台用木质地板.pdf
T-CQTSHRA 008—2024 人才测评服务业务规范.pdf
T-CAMDI 009.10—2020 无菌医疗器械初包装洁净度 第10部分:污染限量.pdf
GB-T 23007-2022 信息化和工业化融合管理体系 评定分级指南.pdf
青藤云安全 ATT&CK 实战指南.pdf
DB11-T 1190.1-2015 古建筑结构安全性鉴定技术规范 第1部分:木结构 北京市.pdf
GB-T 5171.22-2017 小功率电动机 第22部分:永磁无刷直流电动机试验方法.pdf
GB 29437-2012 工业冰醋酸单位产品能源消耗限额.pdf
GB-T 37681-2019 大型铸钢件 通用技术规范.pdf
1
/
3
10
评价文档
赞助2.5元 点击下载(1.7 MB)
回到顶部
×
微信扫码支付
2.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。