联系我们
返回上一页

基于第二代个人征信系统的信用评分研究

刘新海 全联并购公会信用管理委员会常务副主任/北京信用学会副会长。

刘重   某金融机构CRO

 

一、央行征信二代对风控的影响

      央行征信系统是整个信贷市场的重要基础设施。第一代征信系统就是传统的央行征信系统,从2006年上线已经发挥了很大的作用。第二代征信系统(简称“征信二代”)也已经上线了一段时间了,其主要是在新的信息技术和数字经济的场景下,将系统性能提高,与时俱进。到2019年底,央行征信系统已经有3737家信贷机构,还包括很多已经消亡的P2P机构。央行征信系统主要是面向银行信贷和信用卡服务,现在也逐渐接入了更多小微金融和互联网金融等小型的信贷机构。根据清华大学李稻葵教授做的一项研究报告,央行征信系统对GDP有很大的拉动作用,直接拉动GDP上升达到0.33%。央行征信中心也开发了信用评分(数字解读)的产品,主要面向信用卡和零售信贷,目前有202家参与,141家正式开通了查询。因为数字解读的使用有一个严格的测试程序,有明确的理由和效果才能够去使用,并不是3737家都可以使用信用评分。目前信用评分累计查询241亿笔,其中2019年是104亿笔。信用评级在信贷审批、风险定价、额度管理、风险预警和催收方面都发挥了作用。

      2020年1月之后,因为征信二代的上线,有的媒体很夸张地说征信二代是“史上最严征信”,其实这带有很大的误读。其实征信系统从全球来说都不具有单一的监管功能,就是一个基础设施服务机构,就像是一个金融信息的高速公路一样,它不存在“严不严”的问题。另外,征信二代的变化也没有想象那么大,它的整体变化主要在于两个方面:一个方面是很大程度要解决系统性的处理效率的技术问题,即非功能性问题(所谓功能性问题就是征信服务、征信产品的开发);另一个方面是解决个人和企业征信系统的互联互通。这个是非常有价值的,现在全球都做不到这一点,因为全球很多的个人征信和企业征信都是两回事,差别非常大。银行等信贷机构也纷纷上马二代征信报告指标变量、信用评分项目等等,很多公司也在积极参与。

      同时征信二代在微观的数据上也做了一些变化。比如说取消了分期付款,从过去的两年历史表现变到五年历史表现,增加了上一次查询日期、机构和原因,对融资融券(证券融资)近六个月的平均还款信息进行了采集和整理。这体现了我们公共征信机构的制度优越性,不完全出于商业利益的考虑,可以共享更多的信息。

 

二、基于央行征信二代的信用评分研究

      央行的数字解读之所以叫“数字解读”,是因为央行征信中心作为一个政府部门,直接推出这种市场化产品——信用评分的话是有顾虑的。包括消费者权益、公平正义、误差率等因素都不是政府机构能够承受的,所以为了慎重起见,就用了“个人信用报告数字解读”这个名字。央行征信的个人信用评分目前已经推出多个版本,主要是面向信贷和信用卡,其中有一个是和费埃哲(FICO)公司合作。

      央行二代征信报告和数字解读可以认为是国内信贷风控创新的基础,我们在进行风控的时候首先还是要把征信报告用好,把数字解读用好。在使用央行信用报告时,可以将基于账户明细的200余个数据项分成信用敞口、信用历史、信用负债、偿付能力、逾期记录等几大类,然后再一层一层地细分。如图一所示。

图一  基于央行征信报告的消费者信用属性细分

      个人征信报告在全球其实都是类同的,都是200多个数据项就可以覆盖,然后再在其基础上开发各种各样的评分和产品,不像中国和美国的企业征信差别是非常大的。因此,一个基本重要的工作就是对数据项进行深入的理解,对这些特征做一些特征工程。这个特征工程不是说机器学习就能够搞定的,它需要加上经验和我们对风险的一些概念的深入理解,才能明白其背后的逻辑。

      信用评分的标准化流程也是经过了很多年的锤炼,是一个比较完善的、比较细致的、比较成熟的一个规范。它包含了定义目标变量、选取样本、决定适用人群、子群划分、建立信用属性、信用属性初选、信用属性转化、模型拟合、模型验证、负向因子生成(可选)、模型定性监测和模型重新拟合与重建等12步,如图二所示。

图二  个人信用评分的标准化流程

      央行征信的数字解读目前在银行领域应用的是比较好的,这里有两个例子可以说明。江苏银行的信用评分在客户区分度、排序、稳定性、违约率等性能都有提高。在覆盖率方面,数字解读在信用卡新增客群上的总体覆盖率为80%不同申请时点的覆盖率变化较小,其对于信用卡新增客群的可应用性较强。其次在保持审批通过率不变的情况下,使用数字解读前江苏银行违约客户占比为0.4%,使用数字解读后违约客户占比为0.12%,违约客户占比明显降低,说明利用数字解读可有效降低信用卡通过客群的风险。

             图三 央行个人信用评分在江苏银行应用效果示意

      如图四所示,广州银行在使用数字解读后,信用卡贷前贷后风险区分性能得到了很好的提高。其贷前KS值可以达到50%,贷后KS值可以达到70%。

图四  央行个人信用评分在广州银行应用效果示意

      作者的信用评分团队也和一些新兴的小贷机构开展一些合作,发现央行数字解读这个产品的效果不是特别好。这是因为央行开发数字解读,设定主要的消费者客户人群是信用卡和银行的零售信贷客户,不是以小贷场景下的消费者人群为主。但是央行的信用报告还是非常有用的,很多新兴信贷公司利用信用报告的数据项进行特征工程,定制化地做信用评分,也是取得了一个非常好的效果,甚至可以解决80%的个人信用评估问题。

      央行二代征信做了调整以后,一个非常好的改变就是从两年的历史表现到五年的历史表现,因为这种趋势数据可以提供更加精细的风险信息。并且这个调整也是符合目前全球的风控趋势,比如2011年美国三大征信机构的征信报告从24个月增加到了30个月,也增加了数据项的精度,甚至把支付的具体表现也加进去,因此这被称为个人信用报告25年的最大变革。而且2016年在美国的住房抵押中也开始了应用,因为更多的数据、更多的维度可以更好地精准地了解借款人欠债的风险。就像我们熟悉一个人一样,如果我们接触的时间比较长,我们会更了解;信用风险风险也是一样的,有了趋势数据,我们就可以更好地进行风险评估,发现欠债的风险。

      大数据和人工智能在个人信用评分中的广泛应用目前还处于探索的阶段,国外的征信机构都在用一些替代数据进行循序渐进的研究。征信报告上的信贷数据是直接相关的,替代数据就是非信贷类的信用数据,比如公用事业的缴费情况、水电煤气的支付数据、电信的后付费数据等等,这些都是跟还款能力、还款意愿是相关的,但它们都不是直接的信贷数据。人工智能在风控的应用已经开展了很多年了,像国外的征信机构、信用评分公司在很多年前就开始用神经网络做信用评分,效果还不错,它们目前也在研究社交数据和互联网数据。但是人工智能只在局部的一些场景在使用,并没有广泛地推广使用,其主要原因是因为人工智能、大数据、神经网络这些技术在稳定性、可解释性、合规性上都存在问题。比如说我们曾经和国内某家大型互联网公司合作,他们就直接把深度神经网络用来信用评分,当时的效果很不错,但是一个月之后就失效了,不如基于信贷数据的传统模型稳定。

      目前很多金融公司和科技公司也在尝试,比如线上行为、社交媒体等都在某些场景中是有效的,但是推广的话还存在普遍适用性、合规性、个人隐私等很多方面的挑战。美国运通现在在人工智能上取得的一些成果都是在单点突破方面,比如人工智能用于欺诈检测上效果是非常不错的,在实验室研究成功之后现在也开始了商用。

 

三、新冠疫情对个人信用评分的影响

      新冠疫情对整个征信系统、信贷市场的影响是非常大的。国外的征信机构或者是信用评分公司的话它都对疫情带来的新的风险推出了一些相应的产品。比如费埃哲弹性指数(FICO Resillience Index)主要就是对消费者在疫情冲击之后能否还款这种脆弱性做了一个分析和训练。它用的指标还是信用报告的指标,再加上一些宏观的因素,就是目标变量做了一些改变,原来是能不能及时还款,现在就是消费者经济状况对疫情的反应程度。费埃哲弹性指数目前已经开始在试用,可以放在个人征信报告上。它的值从1到99,较高的值表示财务压力的敏感性更高,即在疫情的冲击下容易还不上款。因此费埃哲弹性指数可以帮助金融机构通过更好的投资组合管理、监管压力测试、更好的损失准备金准备、二级市场的透明度等应对不断变化的经济周期。

      费埃哲弹性指数这个信用评分也存在很多争议,虽然对于银行信贷机构来说是个好事,但是对于消费者来说并非如此,因为这样就会多了一个拒绝给消费者放款的理由。由于受到疫情冲击,很多消费者是很脆弱的,如果银行放贷时把这个脆弱性用上,在消费者最困难的时候还不给他放款,会雪上加霜,因此存在很大的争议,各个信贷机构对其应用也持谨慎态度。

图五  费埃哲弹性指数示例

      对于新冠疫情对国内信用评分的影响而言,我们发现国内很多信用卡中心的实际逾期率都会存在一个明显的上升。因为美国经历过飓风、9·11等很多风险事件,经历过很多周期,信贷机构、征信机构都有很多措施,比如用一些特殊的代码来表示,然后在信用评分中做一些处理。国内由于制度的优越性,比如对于驰援湖北的医护人员、受疫情感染的患者等都有延迟还款或减免的措施,这些消费者在疫情期间的信用评分还是不错的。但是政策期(减免期、延迟还款期)过了之后,这些用户的逾期就暴露出来了,他们的还款能力就会变差。所以信用评分在这段时期就没有真实反映用户的信用风险水平。

      一般而言,征信评分最重要的变量是用户过去一段时间的逾期状态,但如果用户过去的逾期状态由于外部因素的影响而失真了,那征信评分的效果就会变得很差。这个时候不仅使用者要非常小心,评分的开发者也要想办法避免这个问题。目前解决的思路大概有两条:一条是根据用户实际的还款数据计算用户真实的逾期状态;第二条是把开发信用评分的观察点移到疫情中间,这样才能有效地构造出用户在疫情之前和之中很多借款行为的变化情况,才能更好地预测用户将来的风险。这个问题是一个普遍的问题,但是由于央行征信中心跟实际的信贷业务比较远,也没有考虑这个问题,很多银行都是“各自抱佛脚”。而且这次疫情还没有结束,第二轮疫情有可能还会反弹,所以这个问题也是需要在未来深入研究,讨论出一个比较好的办法。

 

四、信用评分面临的新挑战

      传统征信体系在面临着新的挑战。随着金融科技信贷和大科技信贷的崛起,不仅对传统的信贷产生了很大的影响,而且对征信和信用评分也产生了很大的影响,同时又有高频、小额、短期等更加有挑战的风控场景的出现,甚至有信贷专家说对于小额信贷未来将不需要央行的个人征信报告和个人信用评分。

      个人信息监管也趋严,使国内很多大数据公司无所适从,有的也转入地下,大数据不能流转和使用也不是一个很好的事情。数据是一个资产,我们应该好好地充分利用,不能因为它会产生问题,我们就不去使用它,因噎废食。

      另外,消费者征信服务的需求也会越来越多,消费者需要看自己的信用报告、了解自己的信用情况。互联网安全、网络风险、个人信息泄露等风险越来越严重,也需要得到很好的处理。

      最后,如图六所示,根据Google Trends分析全球个人征信服务的趋势,从2015年开始个人信用报告的需求量就明显低于信用评分的需求量。在疫情之后,这种数字化趋势会继续加速,就需要征信和风控机构有更多的数字化信用风险产品出现。

 

  图六   个人征信服务趋势比较

(蓝色表示个人信用评分,红色表示个人信用报告)

      提问:目前在第二代央行征信系统下,中国信用评分基本的数据源和数据质量是否能够基本支持信用评估?

      回答:我觉得对于银行来说可能效果会不错,但是对新兴的小额信贷机构来说可能效果不一定理想。风控产品和信用数据上还需要进行加强研发,无论是对消费者人群的理解,还是需要增加替代数据作为补充的信用信息。

(责任编辑:唐寅灏)

来源:2020(第十六届)中国金融风险经理年度总论坛

 

刘新海:基于第二代个人征信系统的信用评分研究
时间:2020-11-28
演讲题目:基于第二代个人征信系统的信用评分研究
专家简介:中国并购公会信用管理专业委员会常务副主任,北京大学金融智能研究中心兼职研究员
刘新海-精彩问答:第二代央行征信系统下,信用评分基本的数据源和数据质量是否能够基本支持信用评估? 刘新海-基于央行征信的信用评分研究 刘新海-展望新的挑战 刘新海-二代征信对风控影响 刘新海-基于第二代个人征信系统的信用评分研究 刘新海-基于第二代个人征信系统的信用评分研究
请登录!