医药安全标准网
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111636539.2 (22)申请日 2021.12.2 9 (71)申请人 百维金科 (上海) 信息科技有限公司 地址 200433 上海市杨 浦区翔殷路16 5号B 区206-10室 (72)发明人 江远强  (74)专利代理 机构 上海中外企专利代理事务所 (特殊普通 合伙) 31387 专利代理师 杨旺旺 (51)Int.Cl. G06Q 40/02(2012.01) G06Q 10/04(2012.01) G06K 9/62(2022.01) (54)发明名称 贷款违约概率预测方法、 及其电子设备和存 储介质 (57)摘要 本发明涉及贷款违约概率预测方法、 及其电 子设备和存储介质, 包括: 根据用户信贷的原始 数据, 从数据库中提取样本数据, 并根据样本数 据对应的用户历史信贷情况建立用户标签; 从数 据库中匹配每个用户的关联多维度数据, 对采集 的原始数据进行缺失补全和异常值处理, 并按照 7:3的比例切分成训练集和测试集后, 分别对训 练集和测试集归一化处理; 根据模糊核聚类算法 建立KFCM模型, 根据训练集中的数据, 训练并调 整KFCM模型的参数; 采用和声搜索算法优 化KFCM 模型, 得到最优参数; 采用测试集中的样本对 KFCM模型的预测性能进行测试; 以及获取新申请 贷款用户的用户数据, 根据用户基本信息设置人 工阈值规则预测用户是否违约, 识别高违约用 户, 输出用户的决策建议。 权利要求书3页 说明书13页 附图1页 CN 114663213 A 2022.06.24 CN 114663213 A 1.一种贷款违约概 率预测方法, 其特 征在于包括如下步骤: 步骤S1: 根据用户信贷的原始数据, 从数据库中提取建模所需的样本数据, 并根据 所述 样本数据对应的用户历史信贷情况建立用户标签; 步骤S2: 从数据库中匹配每个用户的关联多维度数据, 对采集的原始数据进行缺失补 全和异常值处理, 并按照7: 3的比例切分成训练集和测试集后, 分别对 所述训练集和所述测 试集归一 化处理; 步骤S3: 根据模糊核聚类算法建立KFCM模型, 根据所述训练集中的数据, 训练并调整所 述KFCM模型的参数; 步骤S4: 采用和声搜索算法优化K FCM模型, 得到最优参数; 步骤S5: 采用所述测试集中的样本对K FCM模型的预测性能进行测试; 以及 步骤S6: 获取新申请贷款用户的用户数据, 根据用户基本信息设置人工阈值规则预测 用户是否违约, 识别高违约用户。 2.根据权利要求1所述的贷款违约概 率预测方法, 其特 征在于, 步骤S3包括: S3.1: 初始化KFCM模型中的参数, 即在n个样本点中随机选取c个数据进行聚类中心初 始化; S3.2: 通过公式(1) 建立聚类目标函数, 其中, vi(i= 1,2,…,c)为原始特征空间的聚类中心、 c为类别数、 n为原始特征空间样本数量、 Uik为第k个 样本Xk对第i类别的隶属度、 m为加权指数; 且Uik满足0≤Uik≤1且 其中 S3.3: 计算核空间的欧式距 离, 首先定义核函数为K(x, y)=φ(x)Tφ(y), 然后通过公式 (2)||φ(xk)‑φ(vi)||2=K(xk,xk)+K(vi,vi)‑2K(xk,vi)计算核空间的欧式距离; S3.4: 利用拉格朗日乘数法求解目标函数的极小值, 核空间的欧式距离代入聚类目标 函数中, 并在约束 条件下用拉格朗日乘数法寻优, 分别对J φ关于 μ、 v求偏导, 得到新的隶属 度u的更新公式 (3) 和聚类中心v和的更新公式 (4) 3.根据权利要求2所述的贷款违约概 率预测方法, 其特 征在于, 步骤S4包括: S4.1初始化算法相关参数, 包括: 和声记忆库容量HMS、 和声记忆库 考虑概率HMCR、 音调 调节概率PAR、 音调微调步长BW、 最大迭代次数Tmax; S4.2: 初始化和声记 忆, 具体方法为: 在预测神经网络的待优化参数的搜索空间中随机产生HMS个和声旋律Xi, 将产生的HMS 个和声旋律 组成和声记忆库{X1,X2,...,Xi,...,XHMS}, 其中Xi表示和声记忆库中的第i个和权 利 要 求 书 1/3 页 2 CN 114663213 A 2声旋律; 然后从X的解空 间中随机生成HMS个和声X1, X2,…, XHMS放入和声记忆库, 并计 算每个 和声f(X)值; S4.3: 生成新和声, 具体方法为: 随机产生一个介于0~ 1之间的随机数rand1, 通过与HMCR值进行比较, 按顺序逐个生成 新的和声向量; 在生成 后, 随机产生一个介于0~1之间的随机数rand2, 通过与PAR值进行比较判断 是否微调音调, 微调方式如公式(5) 所示; 通过从和声记忆库学习、 随机创作一个音调和在学习基础上微调音调3种方式产生一 候 选 解 其 中 分 量 由 公 式 ( 6 ) 产生, 其中, Xi是表示从种群的第i列随机选 择一个音调; 在生成 后, 随机产生一个介于0~1之间的随机数rand2, 通过与PAR值进行比较判断 是否微调音调, 根据公式(7) 对选取的个体进行微 调; 如果不满足ran d1<HMCR, 则在变量的取值范 围里重新生成一个新解, 其中, ran d2为[0, 1]上均匀分布的一个随机数, k 为离散变量可能值的个数; 产生rand(0,1)的随机数r, r1, r2, 生成的新和声向量记为x'=(x'1,x'2, …,x'n), 采 用改进的音调 调整规则和自适应参数调优方法产生 新的和声; S4.4: 如果新解xnew比HM中最差的解具有更好的目标函数值, 那么新解加入到HM中, 而 最差的解在HM中被删除, 将产生的新解与和声记忆库中最差解进行比较, 若新解优于最差 解, 则替换掉 最差解, 否则不进行操作, 并重新记录 HMCR和PAR的值; S4.5: 更新和声记忆库, 规定HM中相同解数目不能超过一定数量, 即n(Xnew=xi, i=1, 2,...,HMS)<MaxVec, 其中, n( ·)是计算在HM中相同解个数的函数, MaxVec是HM中相同解的 最大数量, 根据公式(8) 即若f (Xnew)<f(Xworst), 则Xnew=Xworst进行进行记 忆库的更新, 其中Xworst为和声记 忆库中最差解; S4.6: 改进和声搜索算法, 采用公式(9) 确定 PAR值的范围, 其中, PARmax和PARmin分别为PAR的最大值和最小值, m和n分别为当前和最大 迭代次数; 采用公式(10) 确定BW值的范围, 其 中BWmax和BWmin 分别为BW的最大值和最小值, m和n分别为当前和最大迭代次数; 以及 S4.7: 得到最优参数, 若满足最大迭代次数则算法终止, 获取最优的小波神经网络结构 参数, 否则算法转到步骤S3继续执 行。 4.根据权利要求3所述的贷款违约概率预测方法, 其特征在于, 所述KFCM模型还包括数权 利 要 求 书 2/3 页 3 CN 114663213 A 3

.PDF文档 专利 贷款违约概率预测方法、及其电子设备和存储介质

文档预览
中文文档 18 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 贷款违约概率预测方法、及其电子设备和存储介质 第 1 页 专利 贷款违约概率预测方法、及其电子设备和存储介质 第 2 页 专利 贷款违约概率预测方法、及其电子设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 20:30:44上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。