叶远刚 美国卫士保险首席风险官
本次分享的主题是人工智能与机器学习的挑战和机遇。机遇大家可以想到很多,我主要想讲的是挑战。国内很多方面事实上比美国发展得快,我希望可以借这个机会可以跟大家相互交流一下。
我今天首先是从欧美的角度回顾一下金融科技的发展。金融科技当中很重要的就是人工智能的应用,当然也不完全是跟人工智能有关。所以接着我会讲人工智能和金融科技的关系,然后再举几个例子讲讲人工智能和金融科技存在的风险,最后再谈怎么管理风险。
现在金融科技、人工智能发展很快,所蕴含的风险还没有完全显现出来。可能再过四五年就会暴露出很多风险。如果现在没有意识到的话以后可能会带来很大的问题。从2013年到2018年美国和全球的私募基金为金融科技公司的投资来看,从2013年开始,金融科技公司获得的融资不断攀升。当然最大的融资公司就是蚂蚁金融了。如果把蚂蚁金融的部分去掉,事实上2016年、2017年真正是一个高峰。很多投资刚开始的时候也没有一个非常特定的想法,到底要怎么去做。但是金融危机之后,美国经济受到很大的冲击,美国银行业、保险业受到很大的冲击,公司的盈利大大降低。要增加盈利的话,就要用科技来减少成本,提升效率。减少成本就要应用科技。金融科技的发展最早是因为考虑成本的问题,后来人们发现金融科技本身有很多可以创新的机会。
最近几年金融科技的投资有所放慢,大概原因可能有以下几个:首先是从2013年到2018年投资增速很猛,投资者在投了之后发现真正成功的金融科技公司并不多。中国可能还好,像蚂蚁金融、众安这些比较大的成功例子多一点。在美国没有出现一个大的独角兽,没有出现像PayPal这样真正的金融科技公司。
疫情对金融科技可能会有一个重要性的提升。因为疫情,大家用线上或者是Internet比以前更多。可能过了下半年,经济有所恢复之后,金融科技的投资还会增加。
美国和中国一样,金融科技的主要的投资者有两部分,一部分是私募基金,更大的一部分是已经比较大的银行或者保险公司。他们不一定想把金融科技放到自己公司的日常运营上。银行对科技最重要的需求来源于Payment And Settlement,支付与清算是很重要的一点。第二个就是Capital Market。很多数字交易,量化交易,量化投资都是在这里。其他的比如Data Analytics板块也很需要金融科技。因为在金融科技或者人工智能里,Data是很重要的。银行不仅仅需要 Market Data,即股票、证券的数据,还需要很多信用卡、客户行为数据;还有很多保险公司需要 Medical Data,用户的Genetic Data。现在的数据需求可以说是越来越多。所谓的投资当中最核心的一部分就是人工智能和机器学习。
美国近年来在金融科技或者人工智能方面投资比较多的几个方向,可能跟中国不一样。在美国,银行或者保险公司对于金融科技、人工智能、机器学习的投资,一个很大的方向是Loan and Insurance Underwriting。以前很多贷款或者保险的承保是通过个人来交易;现在消费者在网上购买保险,就需要保险公司在线上做承保的决策。做这个决策需要很多数据来支持。美国的信贷体系跟中国不一样,中国的像阿里或者其他公司有自己的一个信贷估评体系。美国很多还是沿用比较老的Fico-score(信用评分)。因此如何通过一些新的方式来做承保决策,是一个很大的转换过程。在保险业,特别是人寿保险,因为保险期限很长,以前决定要承保的话需要抽取做体检。现在如果在网上做承保决定的话,无法做抽血体检,需要的信息量就会很大,否则承保风险会很高。
另外一方面是算法交易或者风险管理。人工智能在用大数据做交易的时候,可以给出交易信号,给予投资者下行保护。在这资产管理方面,主要是Alpha Generation。就是说如何用量化过程创造一个超越市场平均收益的阿尔法。还有Robo Advisors,就是用机器人帮客户做财务管理。这样可以在线上服务大客户,也可以控制成本。在诈骗检测方面,比如信用卡或者保险索赔,只能用机器人或者人工智能来判断。
还有一个方面是Regulation。因为美国有很多法规,美国每个州的法规都不一样,欧洲每个国家的法律都不一样,所以做业务需要把所有的法规弄得很清楚。但机器人可以学习所有的Regulation,能够帮助做出决策。因此需要的人会越来越少。这主要是一个合规与业务流程优化的过程。
最后一点是Customer Experiences,因为美国的很多客服支持以前都是放在菲律宾、印度,或者比较便宜的地方。现在使用机器人和客户聊天,客户体验更亲切,一方面是可以减少成本,另外更重要的可以收集很多客户信息。收集信息有助于再制造新的产品。
总的来说,金融科技的在美国的一共有四大重点领域:一个是支付,另外一个是投资,第三个是贷款。因为很多年轻人不愿意去银行,他们会选择在手机上申请贷款。所以美国有很多小金融科技公司帮助客户在网上获得贷款。
第四个是保险。保险公司考虑的有以下几点:首先是产品设计。产品设计要考虑银行的盈利,要考虑资金的流程,还有所有的法规与风险。这里面是有很多跟大数据、量化、金融都有关系的。之后我们要做风险分析,很多数学模型、会计的分析在这里都会被应用到。
在Marketing and Customer Experiences板块,需要把服务推销到客户,这就要用到很多人工智能或者数学分析。首先要决定跟哪些客户去打交道,然后是怎么用这个模型去定价。定价之后如果决定要承销,也需要一个很长的过程,在这个过程当中机器学习很重要。产品卖完后,Claims也很关键。即如果顾客出险,保险公司如何完成担保与理赔。
对银行业、保险业,人工智能、科技金融会产生非常大的影响。美国的保险业是一个很老的业务,现在这几年做的转变非常大。
现在人寿保险开始广泛应用加速承保。因为人寿保险基本上期限都很长,一般来说都是二三十年或更长的会四五十年,所以风险很大。以前承保时要做很多液体检查,比如血液尿液,这样保险公司可以分析这个人的风险有多大。但是现在很多人觉得太慢,所以很多公司就开始加速承保。用大数据来加速,可以不要血液、不要尿液,就通过大数据做风险评估。
但是这种做法听起来容易,做起来难。因为美国法规严格,特别是人寿保险。因为人寿时间长,承担的风险更大。终身保险往往是一生保,比定期的保险时间更长。时间一长,承保是一个非常艰难、非常高风险的事情。因此我们需要更多的数据。比如你在美国,每次看病,医院一般都有记录,为什么去医院?是什么病?如果吃药的话,拿了什么药?这些信息我们都需要。如果你开车,是不是出过什么事故?开车记录我们也需要。还有个人的信贷保险,因为在美国有FICO Score(信用分),信用分越高,保险公司会觉得你的基本生活比较好,风险可能就会稍稍的低一点。当然我们还需要很多的数据,这只是举的几个例子。
但是最重要的一点是,美国监管机构对银行、对保险公司管得比较紧,因为他们担心保险公司的模型会对不同种族、皮肤、性别或收入的人产生区别对待。因为AI模型都是根据数据,这些数据如果主要来源于比较高收入的白人,那么这个模型对黑人的评估会非常不利。当然如果这个模型的数据都是亚洲人,可能也会对白人也不利。
所以美国的监管机构不仅仅要求模型比较中立,并且中立的程度需要是很高的。因为美国有很多很复杂的种族与阶级区分。因此,虽然人寿保险公司开始用人工智能或者大数据改进它的业务流程、风险管理,但是由于美国严格的监管,目前尚未大范围地使用。
算法交易也是人工智能的一大应用。自20世纪90年代末美国股票交易电子化以来,通过计算机进行的交易稳步增长。首先的话是股票。慢慢开始做外汇。现在做的更多是固收。到目前为止,几乎所有的股票和期货交易都是通过算法进行的。因为市场交易是机器来做,很多投资者也开始慢慢用机器来做投资,所以美国的投资成本是很高的。在亚洲,如果把中国单独列出来,投资成本也会是很高的。
对很多投资者来说,以前他把基金完全交由人来管理,现在很多都是用机器来管理。拿对冲基金做一个例子:在美国,对冲基金现在大概有百分之五十是由量化基金来管制,并且这个比例是越来越高。因为量化交易已经是一个非常明显的趋势。个人的投资决定越来越没有机器的好,特别是从成本上来说。这不是说量化基金什么都好,但是从2008年以后的十年来看,量化基金的表现、收入都是最好的。
但是量化基金这一次受疫情影响,市场中立策略表现很差。这一点说明什么?因为 Market Neutral Strategy是用人工智能最多的策略。因为它是用人工智能来确定什么股票便宜,什么股票贵;如果贵的话就卖,便宜的话就买。所以说市场中立策略是利用人工智能量化技巧最多的。人工智能的模型,在疫情这种非常极端的情况下,已经失效。这个时候个人的经验比机器的能力更强。
虽然过去10年人工智能的投资方式很有效,但是疫情就把它的短板都体现了出来。因为很多模型是用过去的数据来训练,但是现在的情况已经完全不一样了。在美国有两个很大的股票指数,一个叫标普500,一个叫纳斯达克。我用公司自己的模型来展示:这个模型发现哪一个指数便宜,我们就买;哪一个指数贵,我们就卖。一般来说,我们这个模型到了4个标准差之后,就说明这两个股票指数之间的差距已经跟历史行为差得很远。一般到了四五个标准差的话,这个市场应该会返回过来。但是这次到了5月底的某一天,它不但没有返回,还继续往前走,一直到了15个标准差,这是从来没遇见过的。疫情后的市场和疫情前的市场完全不一样了。
所以说金融科技或者人工智能,它有很多潜在的危险。现在潜在危险谈的不多,因为大家对金融科技、人工智能都叫好,都在找机遇。但是这个区域里面隐藏了很多的风险。这些风险如果现在不注意到的话,以后会带来很大的影响。
做我们这行的人都知道,金融科技、机器学习、人工智能,都不是灵丹妙药,只是一种方法和技巧。因为他们都是照着统计来的,我们也都知道统计有一个置信区间,它并不是百分之百正确。另外一点就是,金融业跟其他行业不同,使得机器学习、人工智能有应用的局限性。如果一个行业,它的变动性太多,AI很难建模。因为没有好的数据来训练人工智能模型,模型很难做一个很准确的判断。事实上过去的几年,特别是疫情防控期间的四五个月,已经证明了金融市场是AI模型很难模拟的。它毕竟是个统计应用,统计学很难把市场动荡百分之百地建模出来。
我下面也要谈到一点,这一点金融业和其他行业很不一样。金融市场主要是跟人的行为有关,它不仅仅是一个数据问题,更是一个人跟人关系的问题,人的行为会改变市场。如果说一个人知道市场有一个机会,他会马上有一个投资的方法来改变市场。所以说金融市场的变化是很大的,因为经常有人的参与。
这和无人驾驶或者图片分析都很不一样。现在很热的一个AI应用就是自动驾驶,但是自动驾驶主要是数据分析的问题,没有人的参与,复杂程度不能与金融市场相比。即使是这样,近年来仍有不少关于人工智能失败的新闻。2016—2019年,特斯拉自动驾驶汽车在中国和美国已经造成4名司机死亡。最近美国的监管机构,对高盛在信用卡申请审批的算法中存在的种族歧视问题进行了调查。纽约保险监管机构也发布规定,禁止保险公司在算法承保过程中使用可能基于种族和性别的歧视性数据。
在美国,人工智能方面有些问题已经慢慢开始显现出来了。有一个很大的投资叫Watson For Oncology 。IBM投了六千多万美元,但是因为它的诊断出现了很多错误,所以IBM不得不把这个计划给裁掉。最近在香港,有一个投资者起诉AI对冲基金,因为AI交易模式表现不佳,导致亏损严重。还有许多其他由于人工智能模型导致的代价高昂的失败没有公开披露。我想随着时间的推移,会有更多的问题暴露出来。
所以我们总结一下,在金融方面,人工智能和机器学习最重要的挑战,不是金融数据方面,而是金融市场人的行为很难用建模方式来描述完全。因此有经验的人来参与人工智能的一些运作,是很重要的。
作为公司的话,我觉得最重要是在应用人工智能之前,把所有想做的事情区分一下。举一个例子,你把所有跟 AI有关的事情放在一根线上来。左边是随机性比较高的,右边是确定性比较高的。如果这个模型出错,产生的后果会怎么样?如果说模型出错后果严重,那么一定要管制严格。比如Driverless Car,虽然确定性比较高,但是如果出错了就会死人,风险是很高的。高频交易的随机性很高,因为跟金融市场有关,但是出错一次,模型会立即调整,损失不会太大。
我们可以把所有的产品画在一个平面上,一条轴是可预测性,另外一条轴是每单位错误的成本。比如我们刚才所说,眼部手术如果做了好的话没有太多随机性,但是如果做错了的话就会失明,风险当然是很高的。
这样的话,每家公司就可以确定哪些事情需要人干预多少。明确自己的风险偏好,用人的控制来缓解风险。尽管人的参与会增加成本,也可能失去人工智能的一些优越性,但是可以避免一些风险。这套模式我称之为自动化的前沿。如果以后自动化程度越来越高,就可以跟上层领导有一个非常好的交流:哪些任务需要人,或者要人来帮助,哪些事情可以完全由机器自己操作。总的来说,我们管理者要首先意识到每一个算法都有风险,要评估每个AI算法的下行风险。评估之后要把所有算法放在一起做一个组合,在这组合里面要创建允许特定自动化的风险偏好。这样就决定了自动化前沿,决定了在什么事情上会有人为干预。
另外最重要的就是明确什么是完全不能做的。比如说在美国,保险公司不可以在它的模型里有种族歧视。这叫红线,一定要画。
在人工智能里面最重要的是数据。没有数据就没有人工智能的模型,因为人工智能的模型都建立在数据上。
欧美的监管是非常严格的,特别是对数据。最近在美国,有关数据隐私的问题有很多讨论,加州通过了一个消费者隐私法案,他们为保护消费者隐私制定了高标准,并要求公司满足这些标准。美国其他州的监管机构也在实施类似的法律。欧洲也通过了通用数据保护法规(GDPR)。这是一项保护欧洲消费者数据隐私的法规。它为在欧洲开展业务的非欧洲公司设定了要求,这是一种治外法权。
在欧洲的法律里面,有一个很重要的Right To Erase,就是说如果人去世,或者你不想在网上保存你的数据,你可以要求把所有的信息清除。比如说你在 Facebook或者Google上有很多自己以前的信息,你不想公布,可以要求公司把他们清除。现在美国还没有,在欧洲已经有了相关规定。中国跟欧美的情况都不一样,所以以后人工智能的发展趋势可能也会有很多不同。
(责任编辑:严慧宁)
来源:TGES2020周末在线前沿讲座