本文基于决策树算法设计和构建一个简洁的信贷审批模型,实现自动化和智能化量化和识别风险。前一段时间,是经常刷到某某机构贷款多少,某某学生因为违约金而跳楼自杀?学生由于经济压力还不起,网贷公司就越来越催着还款,其实国家是有法律的,只要利息或者违约金不超过多少,是不需要偿还这么多的资金的,小编也偷偷的查过一些网贷公司,确实很坑,我碰到过那种借三百还四百的,前提条件是没有逾期,这个霸王条约是真的恐怖,所以小编也在这里劝大家,最好不要去接触这个网贷,学生的话,没钱可以和家里沟通,和同学沟通,没必要非得深陷进去,进去了就很难拔出来了,还有很多的女大学生搞什么裸贷,女生还是以自己的名誉为主,虚荣心虽然很难满足,但是可以通过自己的双手来让自己的生活过的更好,好了咱们废话不多说,来到咱们的主题!
结论:
进群:125240963 即可获取数十套PDF,如果需要源码请给小编留言!
- 1 数据集拥有1000个样本和17个特征
- 2 特征集是数值型和因子型的组合
- 3 特征集源自信贷或者信贷人
- 贷款期限跨越4个月到72个月,中位数是18个月
- 贷款金额从250DM到18424DM,中位数是2320DM
5 目标变量分布
table(credit$default)
** 结论**:
- 30%的违约率
第三步:数据准备
1 数据集划分
数据集划分为训练集和测试集。
或者 利用caret包的createDataPartition()函数,进行分层抽样,90%为训练集,10%为测试集。
第四步:建立模型
使用C50包里面的C5.0决策树算法。
** 结论**:
决策树规则集前三行(见红色方框)的规则策略:
- 如果checking account balance 是大于 200DM或者 UnkNown,则可能不违约
- 如果checking account balance 是小于 0DM 或者 在1-200DM之间,并且credit history 是perfect 或者very good,则可能违约
summary(C50_model)会显示混淆矩阵,还会指明训练模型的错误率,如下图所示:
** 结论**:
- 训练模型的错误率:14.8%
决策树算法通常存有过拟合问题。因此,需要对模型做优化处理,然后在测试数据集上面评估模型性能。
第五步:评估模型
测试数据集评估模型性能。
** 结论** :
解决方案:
模型性能调优
第六步:优化模型性能
1 超参数调优
C5.0算法通过自适应提升改进C4.5算法。在C5.0函数里面,通过超参数trials设置。
** 结论**:
2 错误类型的代价分析
对不同类型的错误,赋予不同的代价值
- 设计错误代价矩阵
** 结论**:
- 测试集上面对于违约情况的召回率是79%
所以大家还是远离一些非法机构的网贷,要找肯定也要找上市公司有保障的,这样的公司是不会有非法的暴利收取手续费的,劝勉大家最好是远离网贷,谢谢大家阅读!
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。