文章《基于边缘计算与类脑学习的小微企业风险建模》将小微贷款的难点概括为信贷欺诈、隐债行为、识别企业经营能力、小微企业风险爆发、小微企业违约成本、小微企业获客、小微企业信贷成本、小微企业建模样本和数据获取难度等八个方面。其中,王强专家提到,因为通过亲戚朋友等熟人的借款是不能在第三方征信或者央行征信中表现出来的,所以如何识别就是隐债的第一个难题。如何评估隐债的严重程度有多高就是第二个难题,借款是否为应急还债,同时隐债突然暴雷,还款能力是否下降。在识别企业经营能力方面,王强专家特别提到,从金融贷款角度出发,包括识别企业现在的经营能力、未来持续的经营能力与违约成本;其次,通过评估净利润与净资产可以评估企业还款能力,进而动态监控的经营能力;再次,基于经营能力的风控逻辑和基于提高违约成本(锁定抵押物、第三方保证)的风控逻辑的如何有机组合最后,提高尽调准确度,而且对尽调人员依赖度低。王强专家认为对于小微企业来说,如何获客是个较大的难题。除流量获客以外,目前应用较多的通过线下中介的潜入金融获客也是常用手段,但成本通常较高。此外,获客的同时如何获得评估经营能力与持续性数据也是难题之一。
在此基础上,王强专家认为小微贷款目标整体上有以下三点。第一,是否存在信贷欺诈;第二,隐性负债的程度是否符合要求;第三,监控经营账户状况是否恶化,违约成本是否低于贷款额度。
来源:TGES2020前沿讲座系列-11:金融科技核心技术与应用——王强《基于边缘计算与类脑学习的小微企业风险建模》
王强专家主要从小微贷关键节点、完整小微模型系列、预授信准确性、产品设计、尽调隐债识别等方面进行介绍。其中,他在完整小微模型系列部分强调,小微信贷模型的构建首先需要有全业务场景模型,即风控模型体系覆盖信贷全业务场景。其次,要有稳定的建模数据源。Y数据源来自金融机构放款历史表现,X数据源以央行详版征信报告为核心,结合企业征信数据、营收预测数据、专有集中数据,申请交叉验证数据、第三方合规合法数据等设计的10000+衍生变量。再次,传统与机器学习建模挑战,LR与机器学习算法互为挑战者,以提升区分度为目标(KS、AUC、Gini)。最后,模型要有稳定性保障,全数据集拟合模型测试,小样本,大数据及拒绝推断,保障模型稳定而非偏执。
在提到预授信准确性时,王强专家又表示,首先要利用稳定数据源进行历史征信评分,通过7000+维度数据来进行。其中,数据源包括四类,即关键强数据、营销强数据、交叉验证数据、第三方加信、多头、欺诈数据等。其次,利用上述进行建模,同时进行非征信评分预授信。
对于产品设计,王强专家介绍到,X为商户标签,Y为需要的数据,Z为产品设计要素,XY数据组合成交互变量、常规变量、哑变量,对Z各要素的影响度建模(占比 or Yes No),最终形成最终产品输出。
最后,王强专家还特别提出设计隐债分类器,对隐性负债按照融资渠道或者按照借款用途进行划分。在有效分类的基础上,通过构建模型对隐债进行识别和评估。对于隐债给小微企业偿债能力带来的影响评估包括投资与利润评估、利息数量与高低、现金流状况、行业特征和相似的经营逻辑及社交数据评估。
来源:TGES2020前沿讲座系列-11:金融科技核心技术与应用——王强《基于边缘计算与类脑学习的小微企业风险建模》
王强专家指出,机器学习应用对环境主要有以下要求:第一,负样本占比极小,是均衡学习的算法的主要关键。第二,有标签样本稀缺,从而进行半监督和无监督算法。第三,业务对模型解释性要求偏高。同时对时效性有一定要求,这要求在实际建模中要学会去权衡模型复杂度与精度,并且适当地优化算法内核。第四,业务模型多样。每一个模型都和业务目标有着非常高的联系,因此每一个从业者对业务和模型都有很好的理解,从而为业务定制合适的模型。第五,风控数据源丰富。围绕着人展开的数据皆可用,而数据多样带来的就是新兴技术发展,结构化数据、图像、文本等多个领域的方法都在风控领域有一定应用。
王强专家在自动化规则挖掘方面认为,优质策略的制定需要资深的业务经验以及优秀的数据敏感度保驾护航。因此基于单变量分析、双变量分析、多变量分析以及专家思想从经验出发的策略生成,是风控领域最常用的两种方法。
在对评分卡模型介绍的基础上,王强专家强调对于复杂模型在风控领域的应用,其最大的问题还在于贷前审批对模型的解释性要求极高,因此对于复杂模型解释性的问题,也需要进行额外关注。SHAP作为一种具有一致性的特征贡献评判方法,根据训练样本的子集计算整体模型预测均值,可以提供复杂模型中的特征影响期望。对于复杂模型的解释有很大帮助。
在项目冷启动部分,王强专家提到迁移模型,其主要作用为对源域样本进行筛选,从而用于目标域的策略辅助决策。因此即使业务需求是在线上部署策略,迁移模型对其线下分析也有很大帮助。而对于初步数据积累的场景,迁移学习大多可以有效地辅助模型进行决策优化。
来源:TGES2020前沿讲座系列-11:金融科技核心技术与应用——王强《基于边缘计算与类脑学习的小微企业风险建模》