林亚臣 马上消费金融副总经理(前广发银行首席信贷官)
人工智能在零售金融上的应用已远远走在了其他金融行业的前面。纵观金融的发展历史,零售金融进入数字化和智能化阶段有其必然性。
衡量零售金融发展阶段,可以用以下六个维度来描述:
1)业态环境 –金融机构营业形式(实体或虚拟);
2)运营基础 –如何服务客户;
3)信息处理 –交易信息如何获取和处理;
4)交互模式 - 人、人交互,人、机交互,人人、人机组合交互;
5)管理模式 - 手工管理,手工和系统结合的管理,系统自动管理;
6)决策模式 - 契约模式、基于信用、法律保障为基础,决策规则是如何决策的。
基于以上六个维度,零售金融已经踏上了智能化之路。本文共分三个方面:
一方面是零售金融发展演化之路。以上述六个维度为基础,将零售金融刻画为三个阶段:传统金融,数字金融,和智能金融,并对这三个阶段进行了简要的描述;
第二方面,以现阶段实际案例为依据,讨论了零售金融智能化之路的方向;
最后,第三方面,针对如何监管和践行零售金融智能化,文中提出了十大原则并进行了简要的讨论。
零售金融的发展演变的历史揭示了这个行业发展的基本规律。衡量零售金融发展演变,可以用从以下六个维度入手:
1)业态环境 –金融机构营业形式(实体或虚拟);
2)运营基础 –如何服务客户;
3)信息处理 –交易信息如何获取和处理;
4)交互模式 - 人、人交互,人、机交互,人人、人机组合交互;
5)管理模式 - 手工管理,手工和系统结合的管理,系统自动管理;
6)决策模式 - 契约模式、基于信用、法律保障为基础,决策规则是如何决策的。
那么,零售金融都经历了哪些阶段呢?粗线条的说,有三个阶段:传统金融,数字金融,和未来的智能金融。下面,就简要讨论这三个阶段的基本情形。
零售金融发展之路的三个阶段可以用这六个维度来刻画:
1)业态环境,
2)运营基础,
3)信息处理,
4)交互模式,
5)管理模式,
6)决策模式。
我们用上述六个维度来检验零售金融的传统金融阶段。零售金融发展之路从传统金融开始,而在被六个维度刻画的传统金融中,业态环境是现实社会;其运营基础是靠机构网点铺设下去,然后触达到个体的客户,其服务是通过机构网点深入到社会里面;信息的获得则靠客户提供,客户输入信息时借助一些纸质的材料,也可能借助一点线上的资料,这是信息获得的主要形式,当然也存在一些纸质的资料无法转换成数字形式的情况;而与客户交互还是以人人交互为主;决策通常受到人工干预,授信和以后的各种决策基本是人来做,根据客户填的表看其是否符合条件,有时根据人的经验做判断,其中也借用一些评分等方法来判断,这些都被划归成传统金融,它们主要的特点为人工干预决策;管理上也是人工介入,人工通过线下发一些材料或者打电话等方式管理,比如产生一个白名单决定是否调额。这六个维度方面的工作是普遍存在的现象,在乡村银行、城商行、农商行中广为存在。按照这六个维度方面描述,零售金融的传统金融阶段可以追溯到金融的开端(即可追溯的考古证据出自3800年前的古巴比伦)。
零售金融发展的第二阶段是数字金融阶段,它也是目前主要的发展形式。
在2010年以后,计算机的使用产生了一种新的模式,当时,我们将其称为互联网金融,也可以叫大数据金融,实质上都是数字进入的一种形式。
对应到六个维度中,数字金融是在现实社会加上(移动)互联网的环境下运营的,并且移动互联网占的比重比较大,它的运营基础是大数据,所以信息的收集、采集、处理和再构造所涵盖的内容就比较广泛。
以前只能处理结构化数据,现在虽然不是非常理想的状态,但已可以处理非结构化数据。还有一种叫做半结构化数据,可以通过一些非线性变化转化成结构化数据,因此和客户的交互不是人与人交互,而是通过数字化的形式进行交互,这就要求决策是以系统为基础的全自动化的数字化决策,没有人工干预,管理客户也是全自动的数字化管理,所执行的各种指令推送到客户那里并与客户交互,所传输的信息都是自动化生成的,这就是我们现在所见到的数字金融。还有一些信用卡中心、消费金融公司、以及以互联网为基础的并且有大型网络平台和自身客源的小贷公司也实现了以数字化为基础的数字金融。
那么,什么是数字零售金融,最简短的,就是零售金融全流程数字化。较长一点的定义就是:
在互联网环境(也包括现实社会)中以大数据为基础,以数字化交互、决策、管理为主要运营模式的金融业态。
在此定义下,有很多这样的金融公司已完全进入了数字金融阶段,例如马上消费金融公司。以马上消费金融为例,我们每天处理上百万的信贷申请,通过把重复的、攻击我们的黑名单去除,还剩下几十万的申请,在这几十万的申请中要在几秒钟内一个申请进行决策,还要保证决策的可靠性和准确性,通过人工干预是不可能的,所以需要系统自动化的决策和数字化的交互;管理也是这样,也要完全实现了对客户的数字化管理。
未来的第三阶段展现了一个美好的前景,叫做智能金融。智能金融的环境发生变化,除了现实社会和(移动)互联网,还有物联网。物联网可以使中国几十万亿的动产变成不动产,以后的空间是非常广泛的。虽然我们现在还没建立起物联网,但未来一定会建起来;智能金融的运营基础也发生变化,现在有大数据、云计算、区块链等,在这些方面中最重要的就是智能生态的建设,但从现在来看智能生态的发展基本为0,仅存在于自己的一个小环境。
智能生态是模式化且标准通用的,比如现在上互联网搜索一个东西,如果这个生态已经建立了,便可以马上得到想要的东西。以后的智能生态也是这样,要想辨识某个动物是狗还是猫,会有一个标准的模块,虽然狗的种类很多,但是标准模块直接就能够辨识。尽管这种最理想状态的智能金融还离我们还很远,但是我们已经走向了通往智能金融的道路上。虽然现在处在一个和数字金融犬牙交错的阶段,各方面感知智能都有一点,但远远没有达到理想的状态。比如目前判断某个动物是狗还是猫,机器的视觉智能的误差还是很大。
智能金融的信息模式、信息收集、获取以及信息的广度深度完全变了;按照佛家的说法,六根 - 眼、耳、鼻、舌、身、意,对应的就是视觉、听觉、嗅觉、触觉、感觉等都是获得并智能化处理信息的方法,这也是我们所讲的感知智能;但是后边的“意”则涉及了另一种更有难度的人工智能,叫认知智能。这里牵涉着一个有争议的领域,人工智能的局限性。我个人认为:人工智能在做价值判断方面是它的一个局限性。也就是说,在决策边界清楚的地方,我认为理论上人工智能是可以做到的,但是在决策边界不清楚的地方,由于没有办法把它进行数学化,数学解决不了它的问题,因此就很难用人工智能来解决。人工智能的局限就在于能不能把一个问题数学化,如果不能数学化就不能解决。我们现在所有的人工智能都是基于问题可以数学化,这个问题还牵扯到一个哲学层面的问题——休谟的一个命题,是说从“是”到“应该”。能不能从“是”推导到“应该”,自然界客观存在的“是”或“不是”、“应该”怎么判断,“应该”在计算机语言里边是没有办法编译的,所以“应该”在这个大环境里用计算机或者是把它数学化,现在来看还是不可行。
智能金融的交互模式是完全智能交互,智能交互包括了数字化交互。数字化交互实质上是智能交互的初级阶段,大数据、数字化是智能化的一个准备。因此,我们说数字金融(互联网金融)只是一个过渡阶段,是为智能金融做准备的。在交互上到了一个新的层次以后,运算智能,感知智能以及认知智都会在交互上发挥作用;智能金融的决策是智能化决策,在智能化决策中,当需要人的时候,人也可以来做决策,但是,人的参与不会作为主要的决策模式。届时我们可以达到一个自由状态,可以用人、用数字、用大数据来决策或数字化决策,也可以用机器人来做决策。智能金融的管理是智能化的管理,而不是仅基于数字的管理,它将给客户无限多的维度,没有了维度的限制,对金融、对客户而言是一个无穷维的触达,所以智能化就是运算智能、感知智能和认知智能的全面可用性,只有达到这个程度才能叫智能化。
以上,用同样的六个维度来对智能金融做了简要讨论,这六个维度可以完全刻画智能金融。其本质是智能金融在所有环境里没有限制,无论现实还是虚拟社会(包括互联网和物联网)都可以为其所用,并以人工智能为基础,以智能化交互、决策、管理为主要运营模式,这才是我们追求的智能金融。虽然达到理想的状态还有很长的路要走,但是我们正朝着上述方向努力。
在智能金融的六个维度,我们现在做了些什么、我们现在处在什么位置—环境有现实社会和(移动)互联网环节,但没有物联网,物联网建立要有5G的应用,相信几年后慢慢它会建起来继而形成规模,随后便可以使用。
在将来动产全都变成不动产,在抵押、质押等各种各样的形式中,抵押的不仅是抵押房子,可活动的、可移动的资产都可以拿来做抵押,所以金融领域的范围被大幅度扩大;基础建设有大数据、云计算,也区块链,智能生态(尽管现在还没有,但逐渐会发展起来);信息获取或者处理有大数据,大数据是以机器学习和深度学习为代表的能够处理量大且稀疏的数据的能力,视觉、自然语言、生物模态上也有一些简单的应用。各种各样的事情都有人在深入地研究,但是根本的算法基础不在中国,作为中国科技工作者,在这方面的任重道远。交互方面,现在基本上还是数字化交互,机器人的交互有一点但尚未成气候;智能化决策和智能化管理还没有完全实现,目前可以做数字化决策、数字化管理。在智能化的表现上主要是运算智能,对结构化和非结构化数据通过算法来算出一些评分和分群,和一些智能决策等。
在这个阶段运算智能的运用虽然没有达到完全理想的状态,存在一点误差,但很多方面是可接受的。下面,我们可以看几个实际案例来获得一些感性知识。
马上消费金融的智能化应用于多个领域,服务的银行、金融机构、信托等有近200家,在智慧金融、智能交互、云平台服务、社会服务等都有应用,并均有成功案例。语音识别、声纹识别,还有一些归为情绪识别的情感分析等主要用于银行、保险、信托、零售金融等,应用在精准营销、标签管理、智能双录、智能催收等各个方面。例如催收,人们到公司催收时要有合规信息安全的保护,如果催收放在APP上,必须在合规、信息安全、质量监控有完全保障。例如,实时质检,过去的做法,金融机构必须设置庞大的质检团队,一天过后抽出录音来听具体是谁惹怒了客户、说了一些脏词或说了一些不该说的话,然后,总结改进管理措施,而现在则不需要这样的团队。在人说话的时候,机器人就在旁边听着,人说了些什么、是不是说了不该说的话,机器人时时地听,然后给人打分,如果分数特别高,超过了某个阈值,便马上送到团队长或者经理那里,然后经理马上来处理。再例如智能服务,我们有大量客户但只有少量客服人员,上千的信用卡申请和电话转到智能机器人处理后,大幅提高了金融机构的效率。由于科技的支持和智能化的应用,更复杂的业务已经能够被处理。
在零售信贷方面,马上消费金融现在有200多家场景,中国较大的互联网平台都与其有合作,公司创立了很多系统并能够灵活组装。这些系统有800多个独立的模块、独立的系统可供组装,我们也做了很多机器学习、深度学习、经典统计等各种各样的模型,还有一些催收机器人的应用等,在日后还会不断地优化。
在语音识别方面,催收时,如果借款人是重庆人,那就不能用普通话去向他催收,机器人就会用重庆方言,广西的就要用广西的方言,福建的就要用福建的方言,也就是说要用他们的家乡话来催收,现在已经完全实现了。在服务的时候打进来电话也是同样道理,要能够辨别语言的种类。虽然这些应用马上消费金融已完全落地,但由于当前的科技发展阶段,在实操上仍有人工参与,例如,如果不能解决就要转到人工处理。
在语音机器人方面,能够不断优化服务品质。例如在催收这方面,我们如果用催收机器人的话,便永远不会违规,因为机器人还没有感情,所以不管客户说它什么,机器人还是按照规矩来和客户对话。机器语言不光用在催收和服务,也可以用在营销,比如电销回访或调查任何一个事情,这样就使得我们可以触达更多的客户,而且客户的回馈可以被真实地记录下来,形成一个大数据,然后反复地处理,这使得我们的覆盖范围不断扩大,但要确保分层的精准(哪个层用什么或到了哪一层就不能用机器人),因为它的精准度还没有达到我们的要求。
在自然语言交互方面,其应用处理包括回馈简单的喜不喜欢等和深入调查对产品的情感方面的应用。
在视觉方面,人脸识别发展得相对成熟,马上消费金融用的是自己研究的人脸识别系统,对所有进件和所有申请人做人脸识别并且做活体检验。人脸识别是比对固定的照片和人脸,活体检验是人亲自申请并做唇语动作。现在马上消费金融也在测试生物模态方法,因为活体检验可以通过3D面具被欺诈攻破。但运用生物模态方法,就可以把3D面具防住,因为3D面具有隔一层面膜,使得毛细血管对脸部形成的反光不一样,通过反光可以看是真人还是带了面具。生物模态未来会成为标准的动作、标准的模式、标准的产品,现在对身份证的识别、对各种文档表格的识别均是智能化和自动化的,并都是在我们自己研发并在网上应用的。
在风控方面,整个生命周期运用了很多人工智能,包括与大数据有关的一些东西。马上消费金融目前接的平台场景很多,客户很复杂,主要客户不是银行的客户而是银行之下的客户,其中很多都没有人行征信信息。这样的客户的特点决定了马上消费金融不能像银行那样做决策,即很难找到一些强相关的变量,因此评分卡的方法是不可行的,取而代之的是大规模的机器学习和人工智能方法的应用。消费金融公司服务的客群是没有银行服务或者银行服务比较少的这些客户,所以就出现上述那些现象,信息很薄且很难用一些强相关的变量来刻画客户,从而形成了复杂的模型。最后要把最优化的决策给程序化,使其可以在系统上自动地执行,而且不能执行时间太久,要做到秒级决策。所以在各个环节我们都是系统自动化的决策,用这些分析的工具来完成它,但这样会导致散乱的情况,可能面临十几万的变量。基于此,马上消费金融做了自己的万维智慧空间,把这些变量进行全面的梳理、分析和整合。在这个空间上建立一个风险管理决策平台,再加上这些模型、评分以及复杂网络,基于这些目标设定目标函数决策过程,如此一来我们基本上能够把客户的信息进行细致的处理,去除噪音,提炼信息,做一个尽可能最优的决策。在这个过程当中,所谓的视觉智能,也就是活体检验、人脸识别是核身的重要手段;另外在近百亿级关联关系的复杂网络大规模地运用在反欺诈上,以及各种管理措施,如打上各种各样的标签然后评判,使得风险管理在极其复杂的环境下高效高质的进行。
在专利方面,马上消费金融所提供的产品正在推向市场,每一个产品都是通过国家权威认证。我们今年申请的专利已经达到345项,占整个消费金融行业的54%,越来越多的专利赋予给马上消费金融。
在多模态研究方面,如何继续深化人工智能的研究,如何在金融智能化的道路上走得更远,对此马上消费金融和中国科学院等一些著名高校合作进行前沿的研究。马上消费金融也在其他领域投入大量研发资源,如在虚拟机器人方面,随着5G投入市场,物联网的发展,人工智能有更广泛的应用。马上消费金融推出了第一版的数字人,不仅可以讲述,还可以跟人对话,这些都在测试当中。在智能心理助手方面,马上金融研究心理评分,一个人的还款能力可以用具体的指标来衡量,但一个人的还款意愿的衡量则可以运用智能心理助手和人谈,目前还只是一个测试。我们投入了很多力量在研究这些问题,研究智能心理助手来进行心理评分,来探索如何评价客户的还款意愿。
智能生态是当务之急,也任重道远。但我们相信,随着时间的推移,这个领域的发展慢慢形成。从互联网发展可以看出,自九十年代开始,现在互联网生态建设已达到了很高的水平;尽管智能生态要求更高,未来几十年在智能生态领域也会逐渐会显现令人憧憬的结果。运算智能方面,算法的局限在于算法上革命性的进步不多或者几乎没有。目前算法的进步在于计算机算力的提高和存储,算力的提高使得算法发挥作用,但算法没有改变是一个很大的问题。由于算法没太大改变,会使得人工智能进入感知智能和认知智能的进程减缓,这是因为所有这一切都是依赖于算法的。而算法上的革命性突破仍要归结为基础理论上的突破,例如大数据的基础方面存在理论不完整的问题,因此,加强基础理论的研究和投入刻不容缓。
同时,未来的人工智能发展很大程度上还以来智能生态的建设。智能生态的建设与芯片技术直接挂钩。现在的芯片看似发展很快,算力超强,但是跟人脑相比,在处理边界模糊的问题,还是相当慢的,所以进入到真正的感知智能和认知智能还有很长的一段路。人工智能本身的边界就是数学的可解性,我们世界上的问题不是都可以用数学来描述的,所以无法数学化的问题,人工智能就没有办法。哲学家休谟说“是”和“应该”怎么样从“是”才能到“应该”,“是”在计算机编译语言里边用等号实现了。如果一个语言,不管写多少行的程序,没有等号也就是赋值计算就是空转,没有改变任何事情,不会起任何作用,而等号起的作用就是改变状态。如何描述“应该”这个价值独立见解的判断是人工智能无法企及的圣地,人工智能和人打架永远打不起来,因为人有独立的价值判断,能够做任何事情,计算机的模拟只能是在等号那个地方做事。所以我们对智能金融的发展充满了期待,但是我们也知道它的局限性,不可能像有些人想象的那样,人工智能可以为所欲为。
零售金融走上智能化之路是其自然而然和必然的选择,在金融机构践行智能金融的实践中,应该遵循哪些原则呢?而作为金融机构的监管部门应该遵循哪些原则来监管和指导这些发展变化呢?
现实情况,在技术方面,我们基本进入了数字金融阶段,同时,有一些智能金融的尝试。然而,在现有信息基础建设、法律法规建设、科技发展阶段,金融数字化工作还未彻底完成;在某些市场、业务种类、和业务环节仍需要大量的人工干预,不可为了数字化而强行实施数字化,从而给业务带来风险。但无论全流程实施了数字化,还是部分环节实施了数字化,都应遵循以下十大原则:
1)数据来源的合规性必须保障 – 数据来源必须合法合规,数据的使用必须严格遵循2021年6月11日发布并在2021年9月1日生效的《中华人民共和国数据安全法》原则。这是金融机构开展业务的红线,不能有丝毫的松懈。
2)核身的可靠性必须保障 – 数字金融缺少对客户的人与人的交互,不等于金融机构可以对客户身份有不确定的地方。必须百分之百保证客户身份的确认,有丝毫漏洞都会影响客户的还款意愿,加重风险。
3)在线实时信息传输的合规性和安全性必须保障 – 由于客户个人或金融机构相关信息极其敏感,既要确保实时传输的合规性也要确保传输的安全性。
4)所用决策信息的合规性要求必须保障 – 所有用于决策的信息不能也不应该有任何民族和性别的歧视,不能也不应该使用来源于非客户授权的信息。
5)所用模型和各类评分的有效性必须保障 – 整合多种数据,构造预测模型和评分是大数据风控的基本需要,但必须在非开发样本上得到可靠的验证才能部署实施使用。尽管在理论上无法完美证明模型和评分的有效性,但在足够大的OOT样本上的检验必须同时保持开发时的稳定分布和类似的有效性表现,例如,类似的KS。
6)所实施策略在验证数据集上模拟的有效性必须保障 – 利用模型、评分、变量等所设计的策略,必须在足够大的验证数据集进行模拟,以检验策略的目标指标合理性和可行性。
7)数字化决策或智能化决策的各环节可追踪性必须保障 –必须有一个完善回顾机制,这就要求各种大环节运行细节必须是可追踪的。
8)定期追踪回顾和及时调整优化迭代必须保障 – 因数字化或智能化是以系统自动化决策为主的,而机器学习在理论上尚无法从根本上保证模型的稳健性。这就要求算法或模型或评分必须及时回顾,需要是必须及时迭代。
9)在线自动运行时各环节实时监控和预警必须保障 – 例如,大数据风控在线运行时,对各环节必须进行实时监控和预警,以免造成较大的业务损失。
10)在线自动运行触发预警可及时干预性必须保障 – 数字化或智能化运行设计上,必须设有触发预警是可干预和可返回原状态开关。在必要时刻,进行有效干预。这是因为,现阶段的科技发展仍有很大的局限性,无论是理论还是实践,因此,在实践中必须有完整的plan B。而监管部门,也应针对上述十大原则制定行之有效的监管办法,督促市场参与方遵照执行,这将有助于行业的健康发展和成熟。