作者: 鲍忠铁 图片来源: 达志

大数据风控同传统风控在本质上没有区别,主要区别在于风控模型数据输入的纬度和数据关联性分析。据统计,目前银行传统的风控模型对市场上70%的客户是有效的,但是对另外30%的用户,其风控模型有效性将大打折扣。

大数据风控作为传统风控方式补充,主要利用行为数据来实施风险控制,用户行为数据可以作为另外的30%客户风控的有效补充。大数据风险控制的作用就是从原来被拒绝的贷款用户中找到合格用户,识别出已经通过审核的高风险客户和欺诈客户。

一、银行信用风险控制的原理

金融行业中,银行是对信用风险依赖最强的一个主体,银行本质就是经营风险,不同的风险偏好决定了银行的经营水平。在经济结构调整周期过程中,信用风险管理也是各个银行面临的巨大挑战。

1.两种常见的信用风险管理方式

银行信用风险管理有两种方式,第一种方式是从大量申请人中找到合格的贷款客户,将贷款放给这些人。第二种方式是从申请人中识别出有潜在风险的贷款客户,不将贷款发给这些人。可以简单地认为是找到好种子和识别出坏种子

2.如何找到合格的贷款人?

银行在找好种子时,一般会对好种子进行一些基本限定,从贷款人的学历、年龄、收入、职业、资产、负债、消费等几个方面进行打分,最后综合评级,依据评估分数进行贷款审批,可以简单地认为是风险定价(RBP)。

贷款销售人员主要的任务是找到好种子的用户,通过KYC和风险评估等方式的找到潜在合格客户。这个阶段的风险控制可以认为是一个基线控制,经过风险评估之后,会得到客户的评估分数或风险评级。在控制基线之上的客户会被放进来,认为是潜在合格客户;风险管理部门进一步验证,如果审核通过之后,就会依据分数和级别发放贷款。

3.识别出潜在风险的人

利用数学模型来识别风险客户,目的是找到欺诈客户和未来不会还款的用户。在识别坏种子时,数学模型和坏种子是关键,数学模型决定风控方式是否科学,数据纬度是否全面,结论是否科学。坏种子是用来修正风控模型参数,提升模型的鲁邦性,同时让模型可以不断完善自己。在预防欺诈用户时,行业共享的黑名单也起到了很大的作用。

坏种子对识别出欺诈用户和潜在违约用户十分关键,风控模型是否有效的一个前提就是是否有足够多的坏种子。

4.个人消费金融授信的5P原则

信用贷款分为抵押贷款和无抵押贷款,其中抵押贷款的风险相对较低,风险评估过程中主要关注抵押品的自身价值和贷款覆盖率,贷款用途和还款能力占信用审批权重比例较低。银行过去大量的个人贷款,都是抵押贷款,其中按揭房贷占了很大的比重。

无抵押贷款称为信用贷款,时髦的称呼为消费金融。贷款人无需进行财产抵押,仅仅依靠自身信用分数或还款能力申请贷款。相对于抵押贷款,其风险较高,也是银行信用风险管理的重点领域。这几年消费贷款增加较快,预计2017年同个人消费相关的消费贷款,可以达到27万亿左右。很多银行、信用卡中心、互联网金融公司都在争夺这个市场。

个人金融消费贷款除了遵循CCCP消费金融授信审核标准之外,授信5P原则也经常用于评估客户信用风险。“5P”原则主要是指贷款人情况(people),资金用途(purpose),还款来源(payment),债权确保(protection),借款人展望( perspective)。

贷款人情况

是指贷款人信用情况、个人财力、银行往来记录,其中其个人信用评分比重最高,个人财力次之,贷款人的还款记录和还款意愿也很重要。

资金用途

是指贷款人的借款用途是否合理、合法。是否用于投机领域或高风险领域,例如高利贷或赌博等。资金用途是否合法,同贷款被按时归还相关度较高。

还款来源

是授信审批中最重要的,用来了解贷款客户是否具备还款来源,其偿债能力如何。其中客人的月度薪资收入、资产收入、支出费用、财产价值都高度相关。其中常用衡量标准是无担保贷款不得超过月收入的22倍(DBR小于等于22),月还款金额不得超过客人扣掉所有支出费用后,所剩费用的一半。另外信用卡的授信额度也会被考虑在内。

债权确保

主要是指对申贷客户所提供的各项担保品进行评估,当贷款违约时,银行可以处理担保品,减少带贷款损失。消费金融一般无担保品,因此债权担保不太适用,但是某些消费金融公司会让贷款人购买一个担保产品,一般为贷款总额的2%,可以作为债权确保。

借款人展望

就是贷款人未来违约的可能性,依据贷款人的行业、薪资、职业、职务、学历等因素进行预测,评估未来发生风险的概率。一般入门门槛低、专业程度低,可替代性高度高的工作或行业风险较高。

5.贷前风险控制的重要性。

信用贷款的风险控制分为贷前,贷中,贷后三个阶段。贷前控制主要是找到合格贷款人;贷中控制主要预防抵押品资产减值,无法覆盖贷款标的,或者预防借款人还款能力下降,无法按时归还贷款;贷后控制,主要当贷款发生逾期时,通过催收降低银行损失。其中,贷前风险控制是最为重要的。

摩根大通银行有一个统计,75%的信用风险可以在贷款前进行风险控制,贷后风险控制的有效性大概只用25%。因此对于金融企业,贷款前的风险控制更为重要。在信用卡领域,贷款前的恶意欺诈占整体信用贷款损失的60%,真正贷款到期,不进行还款的的客户只占信用贷款损失的40%。互联网金融企业也是如此。信用贷款风险控制过程中,贷前风险控制是最为重要的。

二、金融行业信用风险控制的挑战

金融行业在过去主要依靠经验和宏观经济形式来实施风险控制,以定性为主,更多依赖风险管理精英的个人能力,特别在经济发展很好的时期,风险管理偏好不太科学,不能够反应出真正的风险水平。定性的风险管理占主体,定量的风险管理起到很小的作用。

现在,越来越多的银行正在重视定量风险管理,积极利用风控模型来实施风险评估。巴塞尔III协议的推行,推动了定量风险评估。大多数中国银行的风控模型大多从国外引入,经过自己定制和改良之后用于信用风险评估。但是信用风险和操作风险比较复杂,由于信息不全以及其他问题,很多国外的信用风险模型效果不太明显。于是大多数中国银行参考国外信用风险评估模型,做了一个中国版本。包括著名的FICO风控模型,现在银行很少直接采用。

在这个中国版本的风控模型中,企业信用贷款过于依赖政府授信和国有企业,这种粗放型信用风险管理在经济结构调整过程中,引发了很高的不良贷款率。对私业务中,过高的信用审核标准,无法为更多的贷款申请人提供贷款,造成了无法为更多人提供服务,特别是在信用消费领域,无法实现普惠金融服务。

银行在个人信用风险管理过程中遇到的主要挑战。

1.缺少坏种子

银行建立风控模型的基本原理是,利用大量坏种子,寻找到共性信息,建立风控模型。在利用另外一批坏种子来优化风控模型,找到合适算法,预测参数,加快收敛等。

坏种子对于建立风控模型至关重要,如果坏种子数量不够,风控模型无法设定参数和修正模型。过去银行严格的信贷审批机制,造成了小额贷款(信用消费信贷)规模很小,产生的坏种子也不多,规模较小的坏种子对于建立信用评估模型不利,,无法优化已有的模型和提高风控模型的适用性。

信用风险常见的算法有参数统计法例如逻辑回归、Bayes风险判别分析法,以及非参数统计方法例如聚类和K-means法,神经网络法。现在应用较多的是SVM支持向量级机方法,其在小样本、非线性及高纬模式识别中有特有的优势。同时SVM也是努力最小化结构风险的算法。

2.数据纬度不全

量化风险评估需要将涉及到此风险的所有相关数据都包含进来,通过模型进行信用风险评估,计算出还款意愿和还款能力。评估采用的基本数据因素有年龄、收入、学历、客户资历、行业、区域等,其占主要部分。信用因素包含如负债状况、缴款记录、理财方式;以及行为因素例如交易时间和频率等。

除了这些变量和因素,其实还有一些因素并没有被考虑到现有的风险评估模型中。例如贷款者的身体健康情况、生活规律、是否参与赌博、是否参与民间借贷等,同信贷违约高度相关的信息没有被考虑到信用风险评估当中。

特别是用户行为特征,几乎很少的信贷评估模型会考虑用户的行为。如果客户在借款前,频繁去澳门赌博、或参与民间高利贷、或有吸毒历史、或者飙车、或者经常半夜出入夜店等危险区域、或经常半夜使用App等。这些危险行为因素都会对其信用风险产生影响,但这些因素原来并没有被考虑到信用风险评估之中。

风险评估过程中,如果数据纬度不全,高相关数据没有被考虑进来,对风控模型是一个大的风险。信用风险评估模型缺少了重要风险因素的输入,其评估结果的偏离度就会较大,评估结果失效的可能性就很大。

3.风险定价不够精细

量化风险管理的一个核心是风险定价,根据银行自身的风险偏好来对资产进行定价,高风险资产定价较高,低风险产品定价较低,根据风险高低来制定资产收益,RBP(基于风险定价)已经成为主流。

大多数银行过于保守,不愿意容忍较高的逾期率和不良率,对于所有信贷产品都一视同仁,严格控制逾期率和不良率水,一旦过高,立即缩紧信贷政策,严格控制贷款规模。复杂的经济环境和风险场景,以及缺少全面数据,让风险管理专家更加谨慎对待风险管理,误杀率远远大于漏放率。

实际上,不同风险的产品应该有不同的信贷风险控制指标,高收益的产品,其不良率应该比低风险的产品要高。例如利率为12%的小额信贷就可以容忍3%左右的不良贷款率,其利差收益完全可以覆盖不良贷款。对于风险较低的消费信贷,其不良贷款率也可以适当放开。在逾期和不良贷款管理中,应该按照风险覆盖程度细化资产定价,不能采用统一的风险偏好,这样才能支持消费贷款,依据风险水平,提供精细化信贷产品。

4.风险模型的自我学习能力和数据的实时性

量化风险成为主流风险管理方式之后,银行也在思考风险评估模型的科学性。影响信用风险管理的因素很多,除了客户自身的还款能力和还款意愿,还有恶意欺诈、外界经济环境、黑天鹅事件等不可预见的因素。信用风险的评估完全依赖风控模型将会产生另外一个风险,就是模型自身学习能力和数据实效性。

好的风控模型需要具有自我学习能力,可以依据输入数据来修正模型,另外模型的抗干扰能力也需要较强,避免大量噪声数据干扰计算结果。具有自我学习能力的模型可以适应外部多种因素的变化,同时也可以自身迭代提高,抵抗外界噪音干扰。

实时有效的数据对于风险评估结果影响也很大,数据是有时间价值的,滞后的数据会影响评估结果,不能反映实时风险变化情况。实时的数据录入和动态信用风险评估现在对银行是一个巨大的挑战,一个月进行一次的风险评估并不能实时反映信用风险变化情况,银行需要找到一个好的方法来建立动态风险视图,不仅仅是信用风险管理,其他的风险管理方法也要向实时数据录入和风险实时评价方向转变。

5.外部风险来源的多样化

现在的信贷市场,不再是银行一家的市场。互联网金融企业的崛起,让客户更加容易获得贷款,同时也加大了银行管理信贷风险的难度。

例如一个客户在银行环境内部授信额度是10万,但是其在外面的互联网金融公司、典当行、民间借贷机构,都有借贷行为,可能总计借贷规模远远超过10万元。客户的高额借贷增加了违约风险,这些不在金融企业内部的借贷行为,银行无法了解,也无法实施有效的信贷风险管理。

信贷环境的复杂给银行信贷风险管理带来的较大挑战,客户信贷信息分散和孤立,造成了外部风险来源的多样化,银行需要寻找一种方式来打破这种信息不对称,购买外部信贷数据可以解决这个问题,但信贷数据的覆盖率也是一个较大的挑战。

以上文字仅代表作者个人观点,并不代表金评媒立场。金评媒独家,禁止转载。

相关推荐