金融视线 |
Financial View
基于BP神经网络的P2P网贷信用风险甄别研究
——以拍拍贷为实例
张鑫 曹帅
上海师范大学 上海 200234
摘要
:本文基于“拍拍贷”网贷平台公布的贷款人违约数据,运用了BP神经网络模型来预测P2P网贷平台贷款
人违约率。其模型预测精度达到了99.8%。并且模型得出影响P2P平台借款人是否违约的前十大指标,按照其重要
程度分别为:当前到期期数、上次还款本金、当前还款期数、标当前逾期天数、待还本金、我的投资金额、总待
还本金、历史成功借款次数、已还利息。同时,通过建立BP神经网络模型,网贷平台可以实现对贷款人信用的评级
和违约预测。
关键词
:P2P网贷平台;BP神经网络;违约预测
中图分类号文献识别码文章编号
:F832.4;F724.6 :A :1673-5889(2020)11-0105-02
一、研究目的及意义
P2P贷款违约风险预警已成为一个需要解决的关键问题。很
多学者运用了Logistic回归和其他方法预测贷款人是否违约,但是
Logistic要求解释变量应是数值型变量,并且其仍属于线性模型,所
以只能解决一些违约贷款的非线性问题。所以,本文利用机器学习
算法——BP神经网络很好地解决了缺失值的问题,并且对非线性问
题的预测更为准确,在预测P2P网贷违约率方面,能有效补充现有的神经网络由三个要素组成,分别是输入层、输出层和隐藏层,处
风险预警模型。理信息先进行向前传播,后进行向后传播。首先输入信息从输入层经
AAA到E信用评级。借款类型分为应收安全标,电商,App闪电,普通
和其他,分别用数字1到4代替。认证成功和失败分别是1和0,学历认
证成功则表示有大专及以上学历,征信认证成功则表示有人行征信报
告,淘宝认证成功则表示为淘宝店主。在2015、2016、2017期间分别
用1、2、3表示。
(三)BP神经网络算法
过隐单元层处理后传递给输出层,每一层神经元的状态只影响下一
层的神经元状态。在输出层如果得不到符合标准的输出,则将反向传
播,将误差信号通过原来的路径传回。在返回的过程中,逐步的修改
连接着各层神经元的权值,这种算法叫做“误差反向传播算法”,即
BP算法。上述过程不断重复,直至误差达标。
二、BP神经网络的理论模型
(一)数据选取与处理
1.数据选取。本文基于“拍拍贷”的实际交易数据。在借款成
功的数据中,总标的数量共有270287条,其中违约标的占8653条,不
违约标的为262634条,违约率为3.2%。考虑到本文违约与未违约标
的为不平衡数据,所以采用欠采样来平衡数据集。具体操作为:从全
部样本中提取8653条全部违约标的,随机抽取未违约标的8653条,样
本数据共计17306条。
2.数据处理。首先,对连续变量进行归一化处理,确保指标的
统一性和可分析性。其次,本文通过随机抽样方法,确保样本随机
性。训练集和测试集的划分比例分别为70%、30%。最后,随机对
样本进行分类和预测,实现BP神经网络模型对P2P网络借贷违约风
险的预警。
此数据处理可以利用SPSS进行实现。
三、BP神经网络的模型建立与实证分析
(一)实证分析
表1 案例处理汇总
Case Processing Summary
Percent
SampleTraining1214970.2%
Holdout515729.8%
Valid17306100.0%
Excluded0
Total17306
样本有5157,没有无效样本。
BP神经网络模型建立的参数如下:
(二)指标体系的构建
本文通过拍拍贷披露的指标为基础,运用BP神经网络模型,得到
变量的重要程度,由此来确定影响P2P网贷的指标。
并且本文采用拍拍贷个人信用评价的借款金额、借款期限、
借款成功日期、初始评级、借款类型等共32个指标赋值为1和0,1表
示当前未违约,0表示当前违约。初始评级分为8类,从1到8分别代表
据案例处理汇总,分配给训练集的样本有12149,分配给测试集的
1.输入层和输出层神经元个数。BP网络输入层的神经元个数为
66个,对应66个个人财务指标;输出层有两个神经元,其中0表示贷款
违约,1表示贷款不违约。
MODER BUSIESS
现代商业
105
本文发布于:2023-05-23 17:48:53,感谢您对本站的认可!
本文链接:https://www.wtabcd.cn/falv/fa/78/101380.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |