雷锋网AI研习社 AI投研邦 活动 专题 爱搞机
业界人工智能 学术 开发者 智能驾驶 新智驾TV AI+金融科技未来医疗网络安全智慧城市 智慧安防 智慧教育 智慧交通 智慧社区 智慧零售 智慧政务 机器人行业云智能硬件物联网GAIR
人工智能正文
0
银行业中的数据挖掘-贷款审批案例
本文作者:雷锋字幕组 2018-08-24 10:46
导语:在我们的例子中,我们试图根据上面给出的输入变量的值来估计给予贷款的概率。
雷锋网(公众号:雷锋网)按:本文为 AI 研习社编译的技术博客,原标题 Data mining for Banking: Loan approval use case,作者为 Youssef Fenjiro。
翻译 | 老周 校对 | 程炜 整理 | MY
银行的基本商业模式是作为金融中介——通过筹集融资和贷款(抵押贷款,房地产,消费者和公司贷款)。后者是两个主要贷款审批和欺诈组成的主要信用风险来源。在这篇文章中,我们将通过使用数据挖掘模型来关注贷款审批。
基于信用评分向零售和企业客户授予信用是关键风险评估工具,其允许通过信誉评分来最佳的管理、理解和量化潜在的债务人的信用风险,与评判评分相比,基于信用评分是更稳健和一致的评估技术。
零售投资组合中的信用评分反映了贷款申请时客户的违约风险,它有助于根据 4 个主要输入数据决定是接受还是拒绝信用申请:
客户信息:年龄,性别,婚姻状况,工作,收入/工资,住房(租金,自有,免费),地理(城市/农村),住宅状况,现有客户(Y / N),客户年数,总债务,账户余额。
信用信息:总金额,用途,月付金额,利率......
信用记录:付款记录和拖欠(付款延迟),当前债务金额,拖欠付款的月数,信用记录长度,自上次信用以来的时间,使用中的信用类型。
银行账户行为:平均每月储蓄金额,最高和最低余额水平,信用额度,支付趋势,余额趋势,未付款数量,超过信用额度的次数,更改家庭住址的次数
特征选择和模型
数据挖掘通过显示哪些特征(因素)对特定结果影响最大来增加理解:关联矩阵有助于消除相关变量,特征选择方法(特别是多元相关)如逐步回归用于过滤不相关的预测变量;它在每一轮中添加最佳特征(或删除最差特征),并在每次迭代中使用交叉验证评估模型误差,以最终保持最佳预测器子集(特征选择主题将在单独的文章中处理)。
逻辑回归和决策树都是用于构建行为记分卡的流行分类技术(监督学习),它们是分析数据集的统计方法,分析独立变量的预测者(或解释者) 和因变量的响应(或结果变量) 之间的关系。在我们的例子中,我们试图根据上面给出的输入变量的值来估计给予贷款的概率。为简化起见,我们将变量数量限制在 4 个预测变量:年龄,收入,平均每月储蓄金额,信用期限之后。
Logistic 回归
在逻辑回归中,目标 y 是二元的 ( 授予 p = 1 /不授予 p = 0) 和 授予信贷的概率 p。目标是找到下面的公式的系数 αi 来预测 P 的 logit 变换。
银行业中的数据挖掘-贷款审批案例
为了找到系数 αi,我们用标记的历史数据训练分类模型,其中 已经知道「授予」/「未授予」的决定,通过使用交叉熵作为损失函数来比较预测 ^ y vs 标签 y:
银行业中的数据挖掘-贷款审批案例
αi 的值是使用其一阶导数和梯度下降等优化算法最小化 L(α0,...,α4)的值:
决策树
银行业中的数据挖掘-贷款审批案例
在决策树(如 CRT,QUAID,QUEST,C5.0)中,我们构建分类模型,学习从数据特征推断出的决策规则以进行预测,生成具有与属性(输入变量)对应的决策节点的树结构。
步骤 1:使用分类准则(Splitting Criterion)(如信息增益,增益比,基尼指数)选择具有最佳分数的属性,该分数将被选择以产生关于目标变量的最纯节点(在我们的例子中,最佳分离的属性授予来自未授予)。
步骤 2:使用结果子集创建根分裂节点,然后通过重用分裂标准来选择下一个最佳属性以生成关于目标变量的最纯子节点,从而对每个子集重复步骤 1
......
想要继续阅读,请移步至我们的AI研习社社区:https://club.leiphone.com/page/TextTranslation/693
更多精彩内容尽在 AI 研习社。
不同领域包括计算机视觉,语音语义,区块链,自动驾驶,数据挖掘,智能控制,编程语言等每日更新。
雷锋网雷锋网(公众号:雷锋网(公众号:雷锋网))
雷锋网原创文章,未经授权禁止转载。详情见转载须知。
2人收藏 分享:
相关文章
数据挖掘评估交叉验证
密歇根大学新进展:AI+可穿戴设备,20秒检测儿童内化 ...
AMiner 新功能:技术趋势分析—挖掘技术源头、近期热 ...
熊辉教授:数据挖掘就像医生诊疗,最新的疑难杂症才 ...
金融数字化转型挑战:从单纯的数据囤积者到数据挖掘 ...
文章点评:
我有话要说……
表情 同步到新浪微博 提交
雷锋字幕组
知情人士
入组微信leiphonefansub
发私信
当月热门文章
贝叶斯神经网络(系列)第一篇
重磅 | AI 第一高校 CMU 的「神经网络 NLP」课,中英字幕独家上线!
计算机视觉(及卷积神经网络)简史
使用卡尔曼滤波器和路标实现机器人定位
一文带你读懂 SegNet(语义分割)
最新文章
DeepMind 明年搬 11 层新总部!盘点这家顶尖 AI 科研机构的高光时刻
斯坦福 HAI 出品:细数全球 18 件 AI 大事记
2019全球智博会将于5月开幕,见证AI创新未来
深度强化学习新趋势:谷歌如何把好奇心引入强化学习智能体
阿里云发布机器学习平台PAI v3.0
史上最大的实体关系抽取数据集!清华大学自然语言处理团队发布 FewRel
热门搜索
深度学习iOS应用平板电脑HTC ViveAMD云存储CES 2015CVPRGalaxy S7api张小龙
热门关键字
热门标签人工智能 机器人机器学习深度学习金融科技未来医疗智能驾驶自动驾驶计算机视觉激光雷达图像识别智能音箱区块链智能投顾医学影像物联网IoTCV微信小程序平台微信小程序在哪CES 2017CES2016年最值得购买的智能硬件2016 互联网小程序微信朋友圈抢票软件智能手机智能家居智能手环智能机器人智能电视360智能硬件智能摄像机智能硬件产品智能硬件发展智能硬件创业黑客白帽子大数据云计算新能源汽车无人驾驶无人机大疆小米无人机特斯拉VR游戏VR电影VR视频VR眼镜VR购物AR直播扫地机器人医疗机器人工业机器人类人机器人聊天机器人微信机器人微信小程序移动支付支付宝P2P区块链比特币风控高盛人脸识别指纹识别黑科技谷歌地图谷歌IBM微软乐视百度三星s8腾讯三星Note8 小米MIX小米Note华为小米阿里巴巴苹果MacBook ProiPhoneFacebookGAIRIROS双创周云栖大会先打智能硬件公司智能硬件QQ红包支付宝红包敬业福智能手机生命游戏余宙es 9038if金奖大朋头盔黑客大战intel iris 540性能无人机 电机mbot蓝魔mos1 maxcar-t免疫疗法ux设计师2015年免费好的致富行业mr视频 htc vive制作更多
联系我们关于我们加入我们意见反馈投稿申请专栏作者
Copyright © 2011-2019 www.leiphone.com 雷锋网-读懂智能&未来 All Rights Reserved 粤ICP备11095991号-1 ICP证粤B2-20150332 0daybank
文章评论