2020,数字经济下个人信息保护的挑战和应对——以App违法违规搜集个人信息治理为例,《 中国信用》第10期
2020,《欧洲全面征信信息共享对信贷市场发展作用实证研究》报告解读与分析,《征信 》第09期
2020,数字经济下 韩国个人征信立法的最新推进,《中国信用》第08期
2020,疫情对全球个人征信体系的冲击,《中国金融》第15期
2020,数字金融下的消费者信用评分现状与展望,《征信》第05期
2020,区块链:一种新的征信视角与技术架构,《征信》第04期
2019,专业征信机构:未来中国征信业的方向,《征信》第07期
2019,构建数字经济时代新金融信用评分模型,《中国银行业》第07期
2019,小微企业征信互联网服务新模式——以美国硅谷金融科技公司Nav为例,《清华金融评论》第06期
2019,全球视角下的婚恋交友“信用+”,《中国信用》第05期
2019,完善征信让生活更美好,《中国信用》第04期
2018,百行征信与中国征信的未来,《清华金融评论》第11期
2018,基于征信大数据分析的担保圈风险管理,《征信》第08期
2018,美国顶尖智库怎么看中国信用体系,《中国信用》第08期
2018,欧盟最严数据保护法规对我国金融科技发展的深远影响,《当代金融家》第06期
2017,征信AI:来自人工智能的信用服务,《当代金融家》第12期
2017,电信大数据在信用风险管理中的应用《大数据》第03期
2016,小微企业征信的美国模式,《征信》第12期
2016,面向普惠金融的个人信用评分新趋势《清华金融评论》第12期
2016,互联网经济下的征信,《中国经济时报》中央级
2016,基于征信大数据的替代信用评分,《征信》第03期
2015,美国个人征信互联网服务新趋势研究,《征信》第12期
2015,传统个人征信机构的大数据征信——以环联为例(下),《清华金融评论》第10期
2015,传统个人征信机构的大数据征信——以环联为例(上),《清华金融评论》第9期
2015,担保圈风险的大数据管控,《上海证券报》
2014,大数据征信应用与启示——以美国互联网金融公司ZestFinance为例,《清华金融评论》第10期
2014,基于企业关联关系的信用风险分析新思路,《征信》第09期
2014,阿里巴巴集团的大数据战略与征信实践,《征信》第10期
2014,大数据挖掘助力未来金融服务业,《金融市场研究》第02期
2013,互联网金融新模式探析,《金融电子化》第04期
2020,数字经济下个人信息保护的挑战和应对——以App违法违规搜集个人信息治理为例,《 中国信用》第10期
2020,《欧洲全面征信信息共享对信贷市场发展作用实证研究》报告解读与分析,《征信 》第09期
2020,数字经济下 韩国个人征信立法的最新推进,《中国信用》第08期
2020,疫情对全球个人征信体系的冲击,《中国金融》第15期
2020,数字金融下的消费者信用评分现状与展望,《征信》第05期
2020,区块链:一种新的征信视角与技术架构,《征信》第04期
2019,专业征信机构:未来中国征信业的方向,《征信》第07期
2019,构建数字经济时代新金融信用评分模型,《中国银行业》第07期
2019,小微企业征信互联网服务新模式——以美国硅谷金融科技公司Nav为例,《清华金融评论》第06期
2019,全球视角下的婚恋交友“信用+”,《中国信用》第05期
2019,完善征信让生活更美好,《中国信用》第04期
2018,百行征信与中国征信的未来,《清华金融评论》第11期
2018,基于征信大数据分析的担保圈风险管理,《征信》第08期
2018,美国顶尖智库怎么看中国信用体系,《中国信用》第08期
2018,欧盟最严数据保护法规对我国金融科技发展的深远影响,《当代金融家》第06期
2017,征信AI:来自人工智能的信用服务,《当代金融家》第12期
2017,电信大数据在信用风险管理中的应用《大数据》第03期
2016,小微企业征信的美国模式,《征信》第12期
2016,面向普惠金融的个人信用评分新趋势《清华金融评论》第12期
2016,互联网经济下的征信,《中国经济时报》中央级
2016,基于征信大数据的替代信用评分,《征信》第03期
2015,美国个人征信互联网服务新趋势研究,《征信》第12期
2015,传统个人征信机构的大数据征信——以环联为例(下),《清华金融评论》第10期
2015,传统个人征信机构的大数据征信——以环联为例(上),《清华金融评论》第9期
2015,担保圈风险的大数据管控,《上海证券报》
2014,大数据征信应用与启示——以美国互联网金融公司ZestFinance为例,《清华金融评论》第10期
2014,基于企业关联关系的信用风险分析新思路,《征信》第09期
2014,阿里巴巴集团的大数据战略与征信实践,《征信》第10期
2014,大数据挖掘助力未来金融服务业,《金融市场研究》第02期
2013,互联网金融新模式探析,《金融电子化》第04期
央行征信系统是整个信贷市场的重要基础设施。第一代征信系统就是传统的央行征信系统,从2006年上线已经发挥了很大的作用。第二代征信系统也已经上线了一段时间了,其主要是在新的信息技术和数字经济的场景下,将系统性能提高,与时俱进。征信二代的变化也没有想象那么大,它的整体变化主要在于两个方面:一个方面是很大程度要解决系统性的处理效率的技术问题,即非功能问题(所谓功能就是征信服务、征信产品的开发);另一个方面是解决个人和企业征信系统的互联互通。
央行二代征信报告和数字解读是风控创新的基础,我们在进行风控的时候首先还是要把征信报告用好,把数字解读用好。在使用央行信用报告时,可以将基于账户明细的200余个数据项分成信用敞口、信用历史、信用负债、偿付能力、逾期记录等几大类,然后再一层一层地细分。信用评分的标准化流程也是经过了很多年的锤炼,是一个比较完善的、比较细致的、比较成熟的一个规范。它包含了定义目标变量、选取样本、决定适用人群、子群划分、建立信用属性、信用属性初选、信用属性转化、模型拟合、模型验证、负向因子生成(可选)、模型定性监测和模型重新拟合与重建等12步。
新冠疫情对整个征信系统、信贷市场的影响是非常大的。国外的征信机构或者是信用评分公司的话它都对疫情带来的新的风险推出了一些相应的产品。比如说FICO弹性指数主要就是对消费者在疫情冲击之后能否还款这种脆弱性做了一个分析和训练。它用的指标还是信用报告的指标,再加上一些宏观的因素,就是目标变量做了一些改变,原来是能不能及时还款,现在就是经济对疫情的反应程度。一般而言,征信评分最重要的变量是用户过去一段时间的逾期状态,但如果用户过去的逾期状态由于外部因素的影响而失真了,那征信评分的效果就会变得很差。这个时候不仅使用者要非常小心,评分的开发者也要想办法避免这个问题。目前解决的思路大概有两条:一条是根据用户实际的还款数据计算用户真实的逾期状态;第二条是把开发信用评分的观察点移到疫情中间,这样才能有效地构造出用户在疫情之前和之中很多借款行为的变化情况,才能更好地预测用户将来的风险。
央行征信也在面临着新的挑战。现在我们面临着金融科技信贷和大科技信贷,这些不仅对传统的信贷产生了很大的影响,对征信和信用评分也产生了很大的影响,同时又有高频、小额、短期等更加有挑战的风控场景的出现。此外,个人信息监管也趋严,很多大数据公司目前就不知道该怎么做了,有的也转入地下,这个也不是一个很好的事情。数据是一个资产,我们应该好好地充分利用,不能因为它会产生问题我们就不去使用它。另外,消费者征信服务的需求也会越来越多,消费者需要看自己的信用报告、了解自己的信用情况。此外,互联网安全、网络风险、个人信息泄露等风险越来越严重,也需要得到很好的处理。最后,从2015年开始信用报告的需求量就明显低于信用评分的需求量,在疫情之后,我觉得这种数字化趋势会继续加速,就需要我们有更多的数字化信用风险产品出现。
来源:2020(第十六届)中国金融风险经理年度总论坛NO.1:信用分析和评级技术发展与应用——刘新海《基于第二代个人征信系统的信用评分研究》
数据产业的热度持续上升,特别是最近将数据要素列为五大生产要素之一,各界非常关注,但是对此的深入理解和研究,国外可能会更超前一点,国内目前只是看到这些表层的数据和商业的模式,背后的逻辑和问题需要更多地研讨。无论是个人征信在内的个人数据,还是企业征信在内的企业数据,很多专家和媒体都持同样的观点,就是数据为王,有数据才能做事情,没数据就无能为力。这个现象跟中国的国情有一定关系,从政府到商业机构到媒体,数据共享的意识普遍比较缺乏。一些大数据公司,手中只有少量数据,它们就自认为非常厉害了,不愿意合作,或者是议价权非常高,这种现象并不健康。目前这些公司的商业发展也都遇到各种各样的瓶颈,因为数据是需要应用的和整合的,否则其价值会大打折扣。
关联分析基于关联关系进行网络建模,从非线性的系统性的观点来看每个企业的风险特点和金融属性,不同的关联关系可以建不同的网络,关联关系是一个非常重要的因素,这些关系既可以是自然产生的,也可以通过计算得出的。以下是两个产品的示例,一是投资集中度,把广东省每个地级市的投资集中度进行了分析,颜色越深,投资越集中,这可以应用到投资分析和市场监管中。第二个产品的话就是企业之间的关联强度。在银行征信中心工作时,一个被关注比较多的问题就是,企业间关系复杂,但企业间的连接强度如何。问题比较复杂,当时没得出结果,后续在北大讨论出了解决方案,用复杂网络分析上比较复杂的最大流方法,计算得出相对统一的标准化结果,根据投资关系、担保关系等,计算出企业间的关联强度。风险的传播会根据关联强度来进行。另外,企业的影响力也会随关联强度的传播而传播,关联强度对营销和风险管理都有帮助。
从理论基础来看,关联图谱的理论基础是复杂网络分析,知识图谱的理论基础是自然语言处理文本挖掘。目标方面,关联图谱的分析服务于风险和投资分析,知识图谱主要解决的是知识管理,搜索和展现等问题。代表性应用上,关联图谱典型应用是COVID-19传染病扩散与防范、担保圈风险管理等,知识图谱的典型应用则是Google知识图谱应用或问答系统。当然,关联图谱和知识图谱是有交叉的,两者都用到了网络建模,还有可视化技术等。
来源:2020(第十六届)中国金融风险经理年度总论坛NO.4:大数据及其应用——刘新海《基于关联关系的新维度数据及其应用》