说明:最全电力标准
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211156462.3 (22)申请日 2022.09.22 (71)申请人 中国建设银行股份有限公司 地址 100033 北京市西城区金融大街25号 (72)发明人 刘涛 房雯雯 王林  (74)专利代理 机构 北京集佳知识产权代理有限 公司 11227 专利代理师 崔清杨 (51)Int.Cl. G06Q 10/06(2012.01) G06K 9/62(2022.01) (54)发明名称 幌子企业识别方法及 装置、 存储介质及电子 设备 (57)摘要 本发明提供了一种幌子企业识别方法及装 置、 存储介质及电子设备, 该方法包括: 当需要对 目标企业进行识别时, 确定目标 企业对应的企业 信息, 其中包括企业基础数据、 交易流水数据、 渠 道登陆数据、 工商数据和征信数据; 在企业信息 中, 确定场景特征数据和每个预设特征维度对应 的特征数据; 将各维度特征数据输入评分模型, 经处理后获得风险评分; 将场景特征数据和风险 评分输入场景解释模型, 经处理后获得场景映射 规则; 依据风险评分和场景映射规则, 确定识别 结果; 若识别结果表征目标企业为幌子企业, 则 确定目标 企业对应的欺诈场景。 应用本发明的方 法, 结合多维度数据进行识别, 可提高识别准确 率, 且可实现欺诈场景的自动化识别。 权利要求书2页 说明书17页 附图4页 CN 115496364 A 2022.12.20 CN 115496364 A 1.一种幌子企业识别方法, 其特 征在于, 包括: 当需要对目标企业进行识别时, 确定所述目标企业对应的企业信息, 所述企业信息包 括企业基础数据、 交易 流水数据、 渠道登陆数据、 工商数据和征信数据; 在所述企业信息中, 确定场景 特征数据和每 个预设特 征维度对应的特 征数据; 将各个所述预设特征维度对应的特征数据输入已构建的评分模型, 经所述评分模型处 理后, 获得 所述目标企业对应的风险评分; 将所述场景特征数据和所述风险评分输入已构建的场景解释模型, 经所述场景解释模 型处理后, 获得 所述风险评分对应的场景映射 规则; 依据所述 风险评分和所述场景映射 规则, 确定所述目标企业对应的识别结果; 若所述识别结果表征所述目标企业为幌子企业, 则确定所述目标企业对应的欺诈场 景, 完成所述目标企业的识别过程。 2.根据权利要求1所述的方法, 其特 征在于, 所述评分模型的构建过程, 包括: 确定每个所述预设特征维度对应的初始样本集; 每个所述预设特征维度对应的初始样 本集包括该 预设特征维度对应的多个样本数据; 对于每个所述预设特征维度, 依据该预设特征维度对应的初始样本集, 确定该预设特 征维度对应的训练样本集; 对于每个所述预设特征维度, 依据该预设特征维度对应的训练样本集, 构建该预设特 征维度对应的子模型; 对各个所述子模型进行融合处 理, 得到融合模型, 将所述融合模型作为所述评分模型。 3.根据权利要求2所述的方法, 其特征在于, 所述依据该预设特征维度对应的初始样本 集, 确定该 预设特征维度对应的训练样本集, 包括: 依据预设的过采样策略, 对该预设特征维度对应的初始样本集进行过采样处理, 得到 第一样本集; 依据预设的数据清洗策略, 对所述第一样本集进行数据清洗处理, 得到所述第一样本 集对应的第二样本集; 依据预设的社区发现算法, 对所述第二样本集进行坏样本扩散处理, 得到所述第二样 本集对应的第三样本集; 依据预设的变量衍生策略, 对所述第三样本集进行变量衍生处理, 得到所述第三样本 集对应的第四样本集; 依据预设的变量筛选策略, 对所述第 四样本集进行变量筛选处理, 得到所述第 四样本 集对应的第五样本集, 将所述第五样本集作为该 预设特征维度对应的训练样本集。 4.根据权利要求2所述的方法, 其特征在于, 所述依据该预设特征维度对应的训练样本 集, 构建该 预设特征维度对应的子模型, 包括: 依据预设的多个集成树 算法, 构建每 个所述集成树算法对应的集成树模型; 对于每个所述集成树模型, 依据该预设特征维度对应的训练样本集, 对该集成树模型 进行训练, 将完成训练的该集成树模型确定为备选模型; 对于每个所述备选模型, 依据预设的预留样本集和跨时间样本集, 对该备选模型进行 验证, 得到该 备选模型对应的验证结果; 依据各个所述备选模型对应的验证结果, 在各个所述备选模型中, 确定目标备选模型,权 利 要 求 书 1/2 页 2 CN 115496364 A 2将所述目标 备选模型确定为该 预设特征维度对应的子模型。 5.根据权利要求2所述的方法, 其特征在于, 所述对各个所述子模型进行融合处理, 得 到融合模型, 包括: 确定每个所述子模型对应的权 重; 按照各个所述子模型对应的权重, 对各个所述子模型进行加权融合, 将融合结果作为 所述融合模型。 6.根据权利要求1所述的方法, 其特 征在于, 所述场景解释模型的构建过程, 包括: 依据预设的场景映射规则集合以及预设的梯度提升决策树算法, 构建梯度提升决策树 模型; 依据预设的场景解释变量及坏样本集合, 对所述梯度提升决策树模型进行训练, 得到 经过训练的梯度提升决策树模型; 判断所述经过训练的梯度提升决策树模型是否满足预设的测试验证条件, 若所述经过 训练的梯度提升决策树模型满足所述测试验证条件, 则将所述经过训练的梯度提升决策树 模型确定为所述场景解释模型。 7.根据权利要求1所述的方法, 其特征在于, 各个所述预设特征维度包括: 基础信息维 度、 企业流水维度、 实控人流水维度、 工商与企业征信维度以及实控人 征信维度。 8.一种幌子企业识别装置, 其特 征在于, 包括: 第一确定单元, 用于当需要对目标企业进行识别时, 确定所述目标企业对应的企业信 息, 所述企业信息包括企业基础数据、 交易 流水数据、 渠道登陆数据、 工商数据和征信数据; 第二确定单元, 用于在所述企业信息中, 确定场景特征数据和每个预设特征维度对应 的特征数据; 第一处理单元, 用于将各个所述预设特征维度对应的特征数据输入已构建的评分模 型, 经所述评分模型处 理后, 获得 所述目标企业对应的风险评分; 第二处理单元, 用于将所述场景特征数据和所述风险评分输入已构建的场景解释模 型, 经所述场景解释模型处 理后, 获得 所述风险评分对应的场景映射 规则; 第三确定单元, 用于依据所述风险评分和所述场景映射规则, 确定所述目标企业对应 的识别结果; 第四确定单元, 用于若所述识别结果表征所述目标企业为幌子企业, 则确定所述目标 企业对应的欺诈场景, 完成所述目标企业的识别过程。 9.一种存储介质, 其特征在于, 所述存储介质包括存储的指令, 其中, 在所述指令运行 时控制所述存 储介质所在的设备 执行如权利要求1~7任意 一项所述的幌子企业识别方法。 10.一种电子设备, 其特征在于, 包括存储器, 以及一个或者一个以上的指令, 其中一个 或者一个以上指令存储于存储器中, 且经配置以由一个 或者一个以上 处理器执行如权利要 求1~7任意 一项所述的幌子企业识别方法。权 利 要 求 书 2/2 页 3 CN 115496364 A 3

PDF文档 专利 幌子企业识别方法及装置、存储介质及电子设备

文档预览
中文文档 24 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共24页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 幌子企业识别方法及装置、存储介质及电子设备 第 1 页 专利 幌子企业识别方法及装置、存储介质及电子设备 第 2 页 专利 幌子企业识别方法及装置、存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:26:08上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。