说明:最全电力标准
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211114041.4 (22)申请日 2022.09.14 (71)申请人 中国平安人寿保险股份有限公司 地址 518000 广东省深圳市福田区益田路 5033号平安金融中心14、 15、 16、 37、 41、 44、 45、 46层 (72)发明人 冷绵绵  (74)专利代理 机构 深圳众鼎专利商标代理事务 所(普通合伙) 44325 专利代理师 姚章国 (51)Int.Cl. G06T 7/00(2017.01) G06T 3/40(2006.01) G06V 30/19(2022.01) G06V 30/41(2022.01)G06V 30/414(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 文档质量检测方法、 装置、 计算机设备及存 储介质 (57)摘要 本发明公开了一种文档质量检测方法、 装 置、 计算机设备及存储介质, 该文档质量检测方 法, 包括: 获取待检测文档图像; 对待检测文档图 像进行文本块提取, 获取至少两个目标文本块; 对至少两个目标文本块进行拼接处理, 获取目标 检测文档图像; 采用预先训练的文档检测模型对 目标检测文档图像进行空间特征融合处理, 获取 空间融合特征; 根据空间融合特征, 获取待检测 文档图像对应的文档质量评分。 本技术方案结合 目标文本块在空间位置这一维度, 对待检测文档 图像进行质量检测, 使文档质量检测更加趋近于 人工检测的效果, 提高文档质量检测的准确性。 权利要求书2页 说明书11页 附图4页 CN 115359038 A 2022.11.18 CN 115359038 A 1.一种文档质量检测方法, 其特 征在于, 包括: 获取待检测文档图像; 对所述待检测文档图像进行文本块 提取, 获取至少两个目标文本块; 对至少两个所述目标文本块进行拼接处 理, 获取目标检测文档图像; 采用预先训练 的文档检测模型对所述目标检测文档图像进行空间特征融合处理, 获取 空间融合特 征; 根据所述空间融合特 征, 获取所述待检测文档图像对应的文档质量评分。 2.如权利要求1所述的文档质量检测方法, 其特征在于, 所述对所述待检测文档图像进 行文本块 提取, 获取至少两个目标文本块, 包括: 对所述待检测文档图像进行文本框检测, 获取至少两个文本框 图像, 并获取每一所述 文本框图像对应的中心坐标和文本 框大小; 基于每一所述文本框图像对应的中心坐标和文本框大小, 对每一所述文本框图像进行 文本块提取, 获取每一所述文本 框图像对应的目标文本块。 3.如权利要求2所述的文档质量检测方法, 其特征在于, 所述基于每一所述文本框图像 对应的中心坐标和文本框大小, 对每一所述文本框图像进行文本块提取, 获取每一所述文 本框图像对应的目标文本块, 包括: 基于每一所述文本框图像对应的中心坐标和文本框大小, 确定每一所述文本框图像中 的目标提取位置; 基于每一所述文本框 图像中的目标提取位置和预设块大小阈值, 获取, 获取每一所述 文本框图像对应的目标文本块。 4.如权利要求1所述的文档质量检测方法, 其特征在于, 所述对至少两个所述目标文本 块进行拼接处 理, 获取目标检测文档图像, 包括: 对至少两个所述目标文本块进行 预处理, 获取至少两个文本处 理块; 获取每一所述文本处理块对应的中心坐标, 并基于所述文本处理块对应的中心坐标, 确定目标空间位置顺序; 基于所述目标空间位置顺序, 对至少两个所述文本处理块进行顺序调整和通道拼接, 获取目标检测文档图像。 5.如权利要求1所述的文档质量检测方法, 其特征在于, 所述采用预先训练的文档检测 模型对所述目标检测文档图像进行空间特 征融合处 理, 获取空间融合特 征, 包括: 采用单通道分割 模块对所述目标检测文档图像进行特征向量提取, 获取多个空间特征 向量; 采用注意力机制模块对多个所述空间特征向量进行特征融合处理, 获取空间融合特 征。 6.如权利要求1所述的文档质量检测方法, 其特征在于, 所述根据所述空间融合特征, 获取所述待检测文档图像对应的文档质量评分, 包括: 采用全卷积网络模块对所述空间融合特 征进行分类处 理, 获取目标分类结果; 采用平均池化模块对所述目标分类结果进行评分处理, 获取所述待检测文档图像对应 的文档质量评分。 7.如权利要求6所述的文档质量检测方法, 其特征在于, 在所述获取待检测文档图像之权 利 要 求 书 1/2 页 2 CN 115359038 A 2前, 所述文档质量检测方法还 包括: 获取训练文档图像, 所述训练文档图像携带文档标签; 对所述训练文档图像进行文本块 提取, 获取训练文本块; 将所述训练文本块依次经过单通道分割模块、 注意力机制模块、 全卷积网络模块和平 均池化模块处 理, 获取每一所述训练文档图像对应的预测标签; 根据每一训练文档图像对应的预测标签和文档标签, 确定目标损 失函数, 在目标损 失 函数收敛时, 获取文档检测模型。 8.一种文档质量检测装置, 其特 征在于, 包括: 图像获取模块, 用于获取待检测文档图像; 文本块提取模块, 用于对所述待检测文档图像进行文本块提取, 获取至少两个目标文 本块; 拼接处理模块, 用于对至少两个所述目标文本块进行拼接处理, 获取目标检测文档图 像; 空间融合模块, 用于采用预先训练 的文档检测模型对所述目标检测文档图像进行空间 特征融合处 理, 获取空间融合特 征; 质量评分模块, 用于根据所述空间融合特征, 获取所述待检测文档图像对应的文档质 量评分。 9.一种计算机设备, 包括存储器、 处理器以及存储在所述存储器中并可在所述处理器 上运行的计算机程序, 其特征在于, 所述处理器执行所述计算机程序时实现如权利要求 1至 7任一项所述文档质量检测方法。 10.一种计算机可读存储介质, 所述计算机可读存储介质存储有计算机程序, 其特征在 于, 所述计算机程序被处 理器执行时实现如权利要求1至7任一项所述文档质量检测方法。权 利 要 求 书 2/2 页 3 CN 115359038 A 3

.PDF文档 专利 文档质量检测方法、装置、计算机设备及存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 文档质量检测方法、装置、计算机设备及存储介质 第 1 页 专利 文档质量检测方法、装置、计算机设备及存储介质 第 2 页 专利 文档质量检测方法、装置、计算机设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 思考人生 于 2024-02-07 20:38:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。