曹劲 KPMG 金融风险管理咨询中国区主管合伙人
大数据技术和人工智能技术越来越多应用于金融风险管理领域,其应用主要基于下面三个方面的背景:
一是金融机构需要提高风险管理的效率和质量。风险管理的本质是解决信息不对称的问题,信息不对称性主要体现在以下两个方面:一是因为时间导致的信息不对称,面向未来金融融资和投资的收益和损失程度是不确定性的;二是资金出资方和资金使用方之间的信息不对称。由此导致的信息不对称需要金融机构投入人力、物力、财力通过管理、工具和方法去克服,从而产生了风险管理的成本,如何高效低成本地克服信息不对称是风险管理的实质性问题。人工智能技术可以帮助金融机构获取对风险更全面的认识、更快的响应和更好的分析,有调研表明人工智能技术可以为机构减少高达10%的风险损失。
二是与金融机构日益数字化的金融前台业务相匹配。金融机构前台业务已经发生了翻天覆地的变化,过去绝大多数的业务是通过线下完成。但是随着互联网、电子计算机、网络、人工智能、大数据等技术日益成熟和完善,金融机构获客的渠道和场景也逐渐多元化和线上化。基于这样的改变,中台风险管理部门必须适应前台多渠道多场景化业务模式的改变。前台希望更快、更迅速、更低成本地完成信贷决策,促使风险管理手段和方法予以提升和改进。
三是人工智能算法在信息缺失、信息量巨大以及非结构化的数据处理方面效果显著,例如客户在办理线上业务的时候,金融机构很难获得一些结构化的数据,获取信息可能是视频、音频、图像等非结构化数据,数据也可能存在大量的信息缺失,传统的风险计量模型很难对这些非结构化数据进行有效的处理。而人工智能算法能有效处理这些数据。
虽然如此,必须强调的是:应用人工智能算法并不意味着完全取代人工决策,其定位应该是现有风险管理方法的补充和改进。风险管理是离不开人的决策,比如风险偏好的选择就是人的决策。以新冠疫情为例,美国拥有最强大的医疗和科技水平,但它的防疫结果差强人意,其中的原因之一是美国政府防疫的风险偏好与中国不一样,它更多偏向经济发展(收益端),而不是抑制疫情(风险端),属于风险容忍度高的风险偏好选择。
人工智能以及大数据技术在信用风险管理领域具有较多的应用,主要体现在以下几个方面:信用评级和决策、信贷监控和预警、反欺诈、资本管理、压力测试、清收和重组等方面。根据国际金融机构应用人工智能以及大数据技术的调研,其应用最多的是信用评级决策、信贷监控预警,和反欺诈。业务领域方面,零售业务是应用最广泛的,各种应用达到了60%以上,企业信贷领域的应用相对较少。
大数据技术可以应用于银行信贷管理的全流程,包括客户细分、客户准入、授信调查与审批、风险预警、贷后管理、不良管理以及信贷组合管理。在客户细分方面,金融机构可以利用人工智能或者大数据技术对客户进行统一视图并且对客户画像精准营销。在客户准入方面,人工智能技术应用于信用评级以及反欺诈两个方面。在授信调研与审批方面,金融机构可以利用大数据技术进行信用风险定价以及额度测算。风险预警方面,金融机构可以开发早期风险预警模型。押品管理方面,最为主要的应用就是大数据押品动态估值模型,例如房地产尤其是个人住宅的估值。以前金融机构是通过第三方机构对押品价值进行评估,因为房地产尤其是住宅的体量大,第三方金融机构对其估值的效率慢并且成本高,大数据估值模型将会极大提高押品估值的效率并且降低估值的成本。不良资产处置领域方面,金融机构利用大数据技术进行不良资产管理主要体现在两个方面:一是催收模型;二是催收管理方案。信贷组合管理方面,金融机构可以利用行业以及客群的大数据信息实现组合层面的风险评估和预警。
人工智能仍面临着一个根本性的问题,即人工智能技术还没有解决自主意识的问题,所以机器还不能拥有自主学习的能力,也就是说,任何人工智能的技术实现必须依靠大量事前提供的数据,在人编制的算法支持下学习才能实现人工智能。大数据的数据来源主要包括内部数据和外部数据两个方面。内部数据包括:客户基本信息、财务信息、产品信息、金融资产信息、交易结算信息以及抵押品信息。外部数据主要包括:人行征信以及其他征信、工商、司法、税务、海关、物流以及电商等。金融机构构建模型之前需要对内外部数据的整合,一是机构内部数据整合,二是外部数据与内部数据的整合,外部数据标准以及规范与内部数据有着较大的差异,金融机构需要对外部数据进行大规模处理和匹配。
大数据模型对传统内部评级模型的提升体现在两个方面:一是多维度数据的引入,二是模型算法的提升。多维度数据的引入包括两项内容:一是对传统内评模型数据的真实性进行校验;二是构建多维度评级模型因子体系。
对传统模型数据的真实性校验主要体现在以下几个方面:对财务指标的评价;经营分析和校验;征信体系校验。财务指标体系校验方面,金融机构可以通过外部可靠的数据源对企业数据的真实性校验,对异常指标进行调整,主要通过外部数据实现对收入和负债的核实。经营分析和校检方面,金融机构可以通过经营分析类数据对财务指标的真实性校验,进行异常识别。征信体系检验方面,金融机构通过人行验证信息实现对企业信息真实性的校检。
对传统内部评级模型升级优化的另一种方法是构建多维度评级模型因子体系,除了传统的以财务因子为基础的评级因子体系,还包括征信因子体系、工商司法因子体系和账户行为因子体系等。基于多维度数据的支持,可以构建多子模型的评级模型架构。多子模型架构模型的构建方法是分别对财务因子体系、交易因子体系、工商因子体系以及征信因子体系分别建立子模型,并进行赋权加总得出总分数。多子模型的优点是可以充分利用各个维度的信息并建立更为全面的评级模型。
对评级模型算法层面的提升也是一个重要的方向:可以考虑使用多种机器学习的算法代替原先常用的统计回归方法,例如业界常用的GBDT、随机森林、神经网络、支持向量机等算法。这类建模方法将更加复杂,这些模型的结果与传统评级模型进行比较,发现对于风险的区分能力和精确性有较大幅度的提升,但基于机器学习算法的评级模型也面临着以下两大挑战:一是过度拟合问题,大数据模型需要不断优化模型来提高拟合效果;二是可解释能力差,大数据模型更多强调的是因变量和自变量的相关性,而非因果性,不利于金融机构前台业务部门和中台风险管理部门的沟通,风险管理的效果也会因此而打折扣。
大数据模型也广泛应用于风险预警,其中同样会出现该类模型的两大问题:一是过度拟合问题;二是可解释能力差,而风险预警模型更加强调风险识别和预判的准确性和灵敏性,所以相对于内部评级,大数据以及人工智能技术应用于风险预警领域更为广泛。同时,风险预警模型与评级模型可以相结合使用,内部评级模型比较偏稳定性,所以常见方法是风险预警模型对内部评级模型的结果做并行调整:当内部评级模型与风险预警模型得出的结果出现较大的差异时,可以发起对评级模型和评级流程的快速调整。
大数据风险模型和传统风险模型的差异主要体现四个方面:
一是数据来源及数据特征的差异,大数据模型数据来源和特征主要有四方面的特点:一是数据较为稀疏,二是数据维度广,三是单变量风险区分能力弱,四是数据来源规范性不足。而传统风险模型的数据质量较高,维度相对单一,数据采集渠道规范性较好。
二是模型开发和运行效率的差异,传统风险模型在模型开发和运行效率方面主要有以下三个特点:一是模型结构相对简单;二是数据来源相对固定;三是计算环境性能要求相对单一。而大数据模型需要海量计算,对存储空间和计算性能要求较高,存储和计算性能要求可能相当于传统模型的数百倍。
三是模型应用目标的差异,对于传统风险模型来说,模型结果的可解释性非常重要,而大数据模型追求的是结果的准确性和灵敏性,更多反映的是广义上信用品质。
四是模型架构技术的差异,传统风险模型采用的是单层模型技术架构,运营维护相对简单。大数据模型采用的是多子模型架构和非线性方法,将稀疏的大数据信息加工成密集信息,再将子模型输出信息作为最终模型的输入变量,非线性算法的实现也要求技术架构更为复杂多变。
(责任编辑:胡兴存)
来源:TGES2020周末在线前沿讲座