(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111636539.2
(22)申请日 2021.12.2 9
(71)申请人 百维金科 (上海) 信息科技有限公司
地址 200433 上海市杨 浦区翔殷路16 5号B
区206-10室
(72)发明人 江远强
(74)专利代理 机构 上海中外企专利代理事务所
(特殊普通 合伙) 31387
专利代理师 杨旺旺
(51)Int.Cl.
G06Q 40/02(2012.01)
G06Q 10/04(2012.01)
G06K 9/62(2022.01)
(54)发明名称
贷款违约概率预测方法、 及其电子设备和存
储介质
(57)摘要
本发明涉及贷款违约概率预测方法、 及其电
子设备和存储介质, 包括: 根据用户信贷的原始
数据, 从数据库中提取样本数据, 并根据样本数
据对应的用户历史信贷情况建立用户标签; 从数
据库中匹配每个用户的关联多维度数据, 对采集
的原始数据进行缺失补全和异常值处理, 并按照
7:3的比例切分成训练集和测试集后, 分别对训
练集和测试集归一化处理; 根据模糊核聚类算法
建立KFCM模型, 根据训练集中的数据, 训练并调
整KFCM模型的参数; 采用和声搜索算法优 化KFCM
模型, 得到最优参数; 采用测试集中的样本对
KFCM模型的预测性能进行测试; 以及获取新申请
贷款用户的用户数据, 根据用户基本信息设置人
工阈值规则预测用户是否违约, 识别高违约用
户, 输出用户的决策建议。
权利要求书3页 说明书13页 附图1页
CN 114663213 A
2022.06.24
CN 114663213 A
1.一种贷款违约概 率预测方法, 其特 征在于包括如下步骤:
步骤S1: 根据用户信贷的原始数据, 从数据库中提取建模所需的样本数据, 并根据 所述
样本数据对应的用户历史信贷情况建立用户标签;
步骤S2: 从数据库中匹配每个用户的关联多维度数据, 对采集的原始数据进行缺失补
全和异常值处理, 并按照7: 3的比例切分成训练集和测试集后, 分别对 所述训练集和所述测
试集归一 化处理;
步骤S3: 根据模糊核聚类算法建立KFCM模型, 根据所述训练集中的数据, 训练并调整所
述KFCM模型的参数;
步骤S4: 采用和声搜索算法优化K FCM模型, 得到最优参数;
步骤S5: 采用所述测试集中的样本对K FCM模型的预测性能进行测试; 以及
步骤S6: 获取新申请贷款用户的用户数据, 根据用户基本信息设置人工阈值规则预测
用户是否违约, 识别高违约用户。
2.根据权利要求1所述的贷款违约概 率预测方法, 其特 征在于, 步骤S3包括:
S3.1: 初始化KFCM模型中的参数, 即在n个样本点中随机选取c个数据进行聚类中心初
始化;
S3.2: 通过公式(1)
建立聚类目标函数, 其中, vi(i=
1,2,…,c)为原始特征空间的聚类中心、 c为类别数、 n为原始特征空间样本数量、 Uik为第k个
样本Xk对第i类别的隶属度、 m为加权指数; 且Uik满足0≤Uik≤1且
其中
S3.3: 计算核空间的欧式距 离, 首先定义核函数为K(x, y)=φ(x)Tφ(y), 然后通过公式
(2)||φ(xk)‑φ(vi)||2=K(xk,xk)+K(vi,vi)‑2K(xk,vi)计算核空间的欧式距离;
S3.4: 利用拉格朗日乘数法求解目标函数的极小值, 核空间的欧式距离代入聚类目标
函数中, 并在约束 条件下用拉格朗日乘数法寻优, 分别对J φ关于 μ、 v求偏导, 得到新的隶属
度u的更新公式 (3)
和聚类中心v和的更新公式 (4)
3.根据权利要求2所述的贷款违约概 率预测方法, 其特 征在于, 步骤S4包括:
S4.1初始化算法相关参数, 包括: 和声记忆库容量HMS、 和声记忆库 考虑概率HMCR、 音调
调节概率PAR、 音调微调步长BW、 最大迭代次数Tmax;
S4.2: 初始化和声记 忆, 具体方法为:
在预测神经网络的待优化参数的搜索空间中随机产生HMS个和声旋律Xi, 将产生的HMS
个和声旋律 组成和声记忆库{X1,X2,...,Xi,...,XHMS}, 其中Xi表示和声记忆库中的第i个和权 利 要 求 书 1/3 页
2
CN 114663213 A
2声旋律; 然后从X的解空 间中随机生成HMS个和声X1, X2,…, XHMS放入和声记忆库, 并计 算每个
和声f(X)值;
S4.3: 生成新和声, 具体方法为:
随机产生一个介于0~ 1之间的随机数rand1, 通过与HMCR值进行比较, 按顺序逐个生成
新的和声向量;
在生成
后, 随机产生一个介于0~1之间的随机数rand2, 通过与PAR值进行比较判断
是否微调音调, 微调方式如公式(5)
所示;
通过从和声记忆库学习、 随机创作一个音调和在学习基础上微调音调3种方式产生一
候 选 解
其 中 分 量
由 公 式 ( 6 )
产生, 其中, Xi是表示从种群的第i列随机选
择一个音调;
在生成
后, 随机产生一个介于0~1之间的随机数rand2, 通过与PAR值进行比较判断
是否微调音调, 根据公式(7)
对选取的个体进行微
调; 如果不满足ran d1<HMCR, 则在变量的取值范 围里重新生成一个新解, 其中, ran d2为[0,
1]上均匀分布的一个随机数, k 为离散变量可能值的个数;
产生rand(0,1)的随机数r, r1, r2, 生成的新和声向量记为x'=(x'1,x'2, …,x'n), 采
用改进的音调 调整规则和自适应参数调优方法产生 新的和声;
S4.4: 如果新解xnew比HM中最差的解具有更好的目标函数值, 那么新解加入到HM中, 而
最差的解在HM中被删除, 将产生的新解与和声记忆库中最差解进行比较, 若新解优于最差
解, 则替换掉 最差解, 否则不进行操作, 并重新记录 HMCR和PAR的值;
S4.5: 更新和声记忆库, 规定HM中相同解数目不能超过一定数量, 即n(Xnew=xi, i=1,
2,...,HMS)<MaxVec, 其中, n( ·)是计算在HM中相同解个数的函数, MaxVec是HM中相同解的
最大数量, 根据公式(8)
即若f
(Xnew)<f(Xworst), 则Xnew=Xworst进行进行记 忆库的更新, 其中Xworst为和声记 忆库中最差解;
S4.6: 改进和声搜索算法, 采用公式(9)
确定
PAR值的范围, 其中, PARmax和PARmin分别为PAR的最大值和最小值, m和n分别为当前和最大
迭代次数; 采用公式(10)
确定BW值的范围, 其 中BWmax和BWmin
分别为BW的最大值和最小值, m和n分别为当前和最大迭代次数; 以及
S4.7: 得到最优参数, 若满足最大迭代次数则算法终止, 获取最优的小波神经网络结构
参数, 否则算法转到步骤S3继续执 行。
4.根据权利要求3所述的贷款违约概率预测方法, 其特征在于, 所述KFCM模型还包括数权 利 要 求 书 2/3 页
3
CN 114663213 A
3
专利 贷款违约概率预测方法、及其电子设备和存储介质
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:30:44上传分享