(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211146961.4
(22)申请日 2022.09.21
(71)申请人 杭州衡泰技 术股份有限公司
地址 310000 浙江省杭州市西湖区教工路
23号百脑 汇科技大厦1215室
(72)发明人 陈定 徐行 吴俊杰 刘冠男
陈宏 张丽君
(74)专利代理 机构 杭州汇和信专利代理有限公
司 33475
专利代理师 吴琰
(51)Int.Cl.
G06F 16/9035(2019.01)
G06K 9/62(2022.01)
G06N 20/20(2019.01)
G06Q 10/06(2012.01)
(54)发明名称
面向多方企业联合信用评级的特征组合筛
选方法及应用
(57)摘要
本方案提供一种面向多方企业联合信用评
级的特征 组合筛选方法及应用, 构建由至少两参
与方以纵向联邦学习参与建模的企业信用评级
模型, 并获取每一参与方的特征数据对训练得到
的企业信用评级模型的沙普利值的边际贡献量;
选取边际贡献量最大的特征数据作为起始特征
数据, 基于起始特征数据采用贪心算法迭代筛选
有效特征数据, 整合所述起始特征数据和所述有
效特征数据作为特征组合, 在保证多方企业信用
数据的隐私性的前提下, 降低模 型的过拟合性的
同时有效地控制了数据成本, 且 可保证企业信用
评级模型的预测性能不受影响。
权利要求书2页 说明书8页 附图3页
CN 115238148 A
2022.10.25
CN 115238148 A
1.一种面向多方企业联合信用评级的特 征组合筛 选方法, 其特 征在于, 包括:
构建由至少两参与 方以纵向联邦学习参与建模的企业信用评级模型, 并获取每一参与
方的特征数据对训练得到的企业信用评级模型的沙普利值的边际贡献量;
选取边际贡献量最大的特征数据作为起始特征数据, 基于所述起始特征数据采用贪心
算法迭代筛 选有效特 征数据, 整合所述 起始特征数据和所述有效特 征数据作为特 征组合。
2.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法, 其特征在
于,“构建由至少两参与方以纵向联邦学习参与建模的企业信用评级模型 ”包括以下步骤:
获取各个参与方的特征数据, 其中所述特征数据标记有企业信用评级结果, 且特征数
据具有相同或重 叠的样本空间但不同的特 征空间;
对各个参与 方的特征数据进行样本对齐, 并对对齐后的特征数据进行计算和加密后输
入到企业信用评级模型中进行 学习;
对各参与方 上传的特 征数据进行全局聚合后更新所述企业信用评级模型。
3.根据权利要求2所述的面向多方企业联合信用评级的特征组合筛选方法, 其特征在
于, 可信第三方服务端将企业信用评级模型下发给各个参与方, 各个参与方利用本地的特
征数据进 行计算得到本次计算结果结果, 采用同态加密的方式进 行加密后再上传给可信第
三方服务端, 第三方服务端根据各参与方上传的本地计算结果, 对企业信用评级模型进行
聚合更新, 并将结果再次下发到各参与方。
4.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法, 其特征在
于, 在“获取每一参与方 的特征数据对训练得到的企业信用评级模型 的沙普利值的边际贡
献量”步骤中, 将 每个参与方的特征数据分别输入到企业信用评级模 型得到优化指标, 基于
优化指标计算每 个特征数据的沙普利值的边际贡献量。
5.根据权利要求1所述的面向多方企业联合信用评级的特征组合筛选方法, 其特征在
于,“基于所述 起始特征数据采用贪心算法迭代筛 选有效特 征数据”包括以下步骤:
S1:整合所有参与方的所有特征数据为全局特征集, 选择起始特征数据作为入模的第
一个特征P1=p1;
S2:固定第一个选定的初始特征组合 Pk, 依次将全局特征集合S中的其余特征与初始特
征组合Pk进行组合, 得到包含 k+1个特征数据的候补特征组合, 并计算所有 k+1的候补特征
组合的沙普利值的边际贡献量, 选择最大贡献的候补特征组合 Pk+1=(p1, p2 ,..., pk ,
pk+1);
S3:计算候补特征组合中相对初始特征组合新增加的特征数据 pk+1带来的沙普利值的
边际贡献量的增量;
S4:判断所述增量Δ φP是否小于 所设定的阈值γ, 若否, 则重复S2至S 4; 若是, 得到筛
选出的特 征组合。
6.根据权利要求5所述的面向多方企业联合信用评级的特征组合筛选方法, 其特征在
于, 在“计算所有 k+1的候补特征组合的沙普利值的边际贡献量 ”步骤中, 对于多个特征数据
组合的候补特 征组合的边际贡献量, 采用组沙普利值的方式进行计算组沙普利值。
7.一种企业信用评级模型, 其特征在于, 采用权利要求1到6任一所述的面向多方企业
联用信用评级的特征组合筛选方法筛选得到的特征组合对企业信用评级模型进行训练得
到。权 利 要 求 书 1/2 页
2
CN 115238148 A
28.一种面向多方企业联用信用评级的特 征组合筛 选装置, 其特 征在于, 包括:
边际共享量获取单元, 用于构建由至少两参与 方以纵向联邦学习参与建模的企业信用
评级模型, 并获取每一参与方的特征数据对训练得到的企业信用评级模型的沙普利值的边
际贡献量;
筛选单元, 用于选取边际贡献量最大的特征数据作为起始特征数据, 基于所述起始特
征数据采用贪心 算法迭代筛选有效特征数据, 整合所述起始特征数据和所述有效特征数据
作为特征组合。
9.一种电子装置, 包括存储器和处理器, 其特征在于, 所述存储器中存储有计算机程
序, 所述处理器被设置为运行所述计算机程序以执行权利要求1到6任一所述的面向多方企
业联合信用评级的特 征组合筛 选方法。
10.一种可读存储介质, 其特征在于, 所述可读存储介质中存储有计算机程序, 所述计
算机程序包括用于控制过程以执行过程的程序代码, 所述过程包括根据权利要求1到6任一
所述的面向多方企业联合信用评级的特 征组合筛 选方法。权 利 要 求 书 2/2 页
3
CN 115238148 A
3
专利 面向多方企业联合信用评级的特征组合筛选方法及应用
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:26:12上传分享