(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202211161439.3
(22)申请日 2022.09.23
(65)同一申请的已公布的文献号
申请公布号 CN 115239215 A
(43)申请公布日 2022.10.25
(73)专利权人 中国电子科技 集团公司第十五研
究所
地址 100083 北京市海淀区北四环中路21 1
号华北计算 技术研究所
(72)发明人 李倩 江鑫雨 郭红钰 刘玉龙
郑扬飞
(74)专利代理 机构 北京惟专知识产权代理事务
所(普通合伙) 16074
专利代理师 赵星(51)Int.Cl.
G06Q 10/06(2012.01)
G06K 9/62(2022.01)
G06N 20/00(2019.01)
(56)对比文件
CN 110020048 A,2019.07.16
US 2019132343 A1,2019.0 5.02
CN 111178704 A,2020.0 5.19
审查员 胡平
(54)发明名称
一种基于深度异常检测的企业风险识别方
法和系统
(57)摘要
本申请提出一种基于深度异常检测的企业
风险识别方法和系统。 方法包括: 采集企业的基
础信息, 将基础信息处理为指标项, 整合多个指
标项构建结构化的企业信息表; 对 结构化的企业
信息表中的各指标项的内在分布关系进行学习,
构建指标项内异常的异常检测指标; 对结构化的
企业信息表中的指标项之间的相互关联关系进
行学习, 构建指标项间异常的异常检测指标; 对
企业的各指标项共同组成和反映的企业整体的
结构化语义信息进行学习, 构建结构化语义信息
异常的异常检测指标; 将上述三个层次的指标融
合, 构建综合异常检测指标; 依据综合异常检测
指标, 得到企业异常评分。 本发明具有构建层次
化的异常检测指标体系, 进而实现全方位、 多层
级的企业异常检测。
权利要求书4页 说明书15页 附图2页
CN 115239215 B
2022.12.20
CN 115239215 B
1.一种基于深度异常检测的企业 风险识别方法, 其特 征在于, 所述方法包括:
步骤S1、 采集企业的基础信息, 将所述基础信 息处理为指标项, 整合多个指标项构建结
构化的企业信息表;
步骤S2、 对所述结构化的企业信息表中的各指标项的内在分布关系进行学习, 构建指
标项内异常的异常检测指标;
步骤S3、 对所述结构化的企业信息表中的指标项之间的相互关联关系进行学习, 构建
指标项间异常的异常检测指标;
步骤S4、 对企业的各指标项共 同组成和反映的企业整体的结构化语义信息进行学习,
构建结构化语义信息异常的异常检测指标;
步骤S5、 将所述指标项内异常的异常检测指标、 指标项间异常的异常检测指标和结构
化语义信息异常的异常检测指标融合, 构建综合异常检测指标;
步骤S6、 依据所述综合异常检测指标, 得到企业异常评分
在所述步骤S1中, 所述将所述基础信息处理为指标项, 整合多个指标项构建结构化的
企业信息表的方法包括:
将采集到的所述基础信息整理成一种三元组的形式化表示: S=<O,A,V>, O={o1,o2,⋯,
oN}其中表示N家企业的集合, oi表示第i家企业, A={a1,a2,⋯,aD}表示D个指标项的集合,
是将企业映射到各指标项对应的指标值的函数集合, 函数
赋予一个企
业特定的指标值, Vj表示第j个指标项的值域; 在三元组形式化表示的基础上, 构建企业信
息表, 具体过程为: 将O按纵向排列, 将A按横向排列, 构建表格; 将oi与
在表格中对应位置
的值赋予vj (oi); 在所述企业信息表中, 第i家企业的指标值表示为向量形式:
;
在所述步骤S2中, 所述对所述结构化的企业信息表中的各指标项的内在 分布关系进行
学习, 构建指标项内异常的异常检测指标的方法包括:
采用频率统计的方法来反映各个指标值分布规律, 将指标内分布关系学习过程转化为
指标值的频率统计过程;
对于各指标项
, 学习指标值分布函数
, 将指标项
中的指标值vj (oi)
映射为其出现的频率
;
构建指标项内异常的异常检测指标为:
其中,
表示i第家企业的指标项内异常的异常检测指标, D表示指标项的总数;
在所述步骤S3 中, 所述对所述结构化的企业信息表中的指标项之间的相互关联关系 进
行学习, 构建指标项间异常的异常检测指标的方法包括:
采用单个指标项与其它指标项的互信 息来反映各指标项间的共现规律, 将指标项之间
的相互关联关系学习过程 转化为指标项之间互信息衡量 函数的学习过程;
对于各指标项
, 学习其与其它指标项之间的互信息衡量函数
, 将指标
项
中的指标值xi,j, 即vj (oi), 以及所述指 标值xi,j对应其它 指标项中的指 标值所构成的权 利 要 求 书 1/4 页
2
CN 115239215 B
2向量
映射为指标值xi,j与所述指标值xi,j对应其它指标项
中的指标值之间的互信息大小
; 其中
表示除aj外其它指标项构成向量的
所在空间;
构建指标项间异常的异常检测指标为:
其中, I2 (oi)表示第家企业的指标项间异常的异常检测指标, D表示指标项的总数;
在所述步骤S4中, 所述对企业的各指标项共同组成和反映的企业整体的结构化语义信
息进行学习, 构建结构化语义信息异常的异常检测指标的方法包括:
首先, 构建K个第四深度神经网络
将
归一化的
结果
转换到第K个隐空间中; 其中,
将指标值归一化到 ‑1到1之间; 然后, 构建
第三深度神经网络
, 将
和
映射为深度空间u的
维向量, 即
和
; 为简化描述, 记
为
,
记为
, 在所述深度空间中, 采用指数化的余弦相似度定义相似度度量
函数, 计算
和
的相似度
;
构建结构化语义信息异常的异常检测指标为:
其中,
表示第i家企业的结构化语义信息异常的异常检测指标。
2.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法, 其特征在于, 在
所述步骤S 6中, 所述方法还包括: 根据所述指标项内异常的异常检测指标、 指标项间异常的
异常检测指标和结构化语义信息异常的异常检测指标, 确定企业风险的来源, 所述企业风
险的来源 包括单指标项异常、 指标项间的关联关系异常和企业数据整体呈现异常。
3.根据权利要求1所述的一种基于深度异常检测的企业风险识别方法, 其特征在于, 在
所述步骤S5中, 所述将所述指标项内异常的异常检测指标、 指标项间异常的异常检测指标
和结构化语义信息异常的异常检测指标融合, 构建综合异常检测指标的方法包括:
其中,
第i家企业的综合异常检测指标,
表示第i家企业的指标项内异常的
异常检测指标,
表示第i家企业的指标项间异常的异常检测指标,
表示第i家企
业的结构化语义信息异常的异常检测指标;
表示
的权重系数, 为人为设置的超参
数;
表示
的权重系数, 为人为设置的超参数;
表示
的权重系数, 为人为设权 利 要 求 书 2/4 页
3
CN 115239215 B
3
专利 一种基于深度异常检测的企业风险识别方法和系统
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:04上传分享