2017年AlphaGo赢得围棋的世界冠军以来,AI成了一个比较主流的科学方法论。AI在语音识别或者在计算机视觉上面,包括在工程科学各个领域都有非常大的影响。嘉实对AI的思考是远远早于社会形成这一共识之前的,其主要源自于长期在投资决策中碰到的一些问题。如5月17日赵学军董事长在“经济研究所建所90周年国际研讨会暨经济研究·高层论坛2019”上所说,做决策面临不确定的结果,这是投资研究的独特性,与研究自然科学、工程项目有一定区别。投资研究应该梳理与科学研究的共性,更要重视它的独特性。
今天分享的内容主要有几点。首先,人工智能和大数据是怎样赋能投研的。有了人工智能和大数据,投研部门发生了大的升级,可以预见到,未来五年、十年,投资会发生革命性的变化。现在我们还是在探索和开拓的阶段,积累了很多失败和成功的经验,现在是探索这些问题最好的时期。其次,是金融市场的本质和投研方法论思考。因为AI太强大,除了算法算力,还有海量数据,这些都导致AI的潜力非常强大。在一个强大的新方法论面前,我们其实要非常小心风险。最后,是大数据的价值挖掘。因为我们可获得更多的数据,AI这一工具加上新的数据,会给我们带来非常丰富的新策略。
一、人工智能与大数据赋能投研升级
目前来看,AI这两三年有突飞猛进的进展,改变了投资的方法,非常有必要掌握AI这种工具作为核心竞争力。AI赋能的重点领域为财务咨询、量化投资和财富管理等。
首先,在财务咨询方面,AI会增强和扩展财务咨询的能力和范围。因为大数据对客户具有精准的了解,过去打包式的产品形态会发生很大的变化,未来可以做到千人千面的个性化的打包方法,提高效率并且用更低费用完成投资流程。
其次,在量化投资方面,量化的一个重要标志就是可以用低成本来做大量的研究,有了AI以后,不只是低成本、高效率,还能够做到定制化、千人千面,所以在商业模式上有很大的赋能。
第三,在财富管理方面,AI可以覆盖更多的新兴市场和低收入人群,提供低成本的获客能力,用科技的方法来给低收入的人群做财富管理。传统的资产管理主要是针对高净值客户,普惠金融可以通过AI来驱动,大数据有助于使用数据生产alpha。AI、大数据、云计算等技术会使得财富行业有非常大的扩展空间,追求超额收益的套利交易会进入新的层面。
很多过去我们处理不了的、效率很低的策略,可以在新的框架中得到更多发展,更高级的数据科学和更广泛的数据源都在给我们赋能。
二、金融市场的本质与投研方法论的思考
有一位作家说,大家交流的大数据精神,就是把所有的数据都拿来,也不经过筛选,就把结构化的和非结构化的数据都混杂在一起,包括海量新闻、社交数据、移动设备的操作行为等,不注重因果关系,只关注相关关系等。而人工智能的本质还是归纳,是一个具有超强算力的统计工具,它的本质是从历史数据中提取规律并预测未来。除了数据质量的问题以外,它本身还存在许多问题,比如可解释性、黑箱方法、过度拟合等,这是AI受到的主要批评。因此,AI要和实际场景结合,要在相关性和因果关系中间进行平衡,然后去突破AI投资的黑箱性质。目前,AI缺乏直接的因果关系检测,使用历史数据做信用模型的,可能对这方面不是那么讲究。但是在投资上,这是非常重要的,包括变量在建模过程的互相依赖性,尤其是时间持续性的检测,有没有自变量可以被其他自变量解释。实际上,这些测量在目前的算法里都是没有的,这也是目前AI的弱势。
找到过去的特征规律是不是能够代表未来的概率?在伊曼努尔·康德的研究中,认为因果律不能来自于经验,而AI的判断大部分都来自于经验。卡尔·波普尔认为,归纳法不能给人类带来必然的知识,所以科学投资、理性投资实际上是有局限性的,因为正轨是不满足证伪主义的。索罗斯说金融市场的本质是不确定性,这种不确定性是根本的、是绝对的,任何知识都是可能被证伪的。所以在运用AI时,一定要有所警示,投资策略是不是仅自己认为有效,这是非常重要的。
三、人工智能在资产管理中的应用
AI的缺陷不意味着AI不能做投资研究,在一些好的场景,选取正确的投资工具的时候是可以的。比如,在因素相对比较简单、驱动因子可以简化的情况下,AI可以做投资,包括在高频交易、市场中性模型、短期套利策略等情景下,AI可以发挥强大的优势。目前中国的金融机构还无法实现靠算力和数据完成高频交易,因为这需要投入巨大的计算资源,而一般的公司没有这么大的计算资源来完成高频计算市场冲击模型。但JP Morgan已经实现了,因为美国对交易成本的控制非常严格,JP Morgan花费了640个CPU和2880个GPU,最终回测统计量表明通过利用增强学习算法可以降低交易对市场价格的影响,节省交易成本。
嘉实在AI研究方面是相当领先的,理论和认知先行,嘉实通过在学术上的交流和发表论文来提高自身的生产能力。
(一)AI在利率债定价方面的应用
我们认为利率曲线的运动反映了市场投资者的博弈结果并且包含着规律,那么利率曲线,尤其是国债的无风险利率曲线,是可以被学习和预测的,而利率曲线是所有利率产品,包括衍生品的定价基础。下图是从2012年到2018年,每一周的利率曲线的演化过程。利率曲线之所以能够被学习,是因为利率曲线本身有一个规律,不会随机地取一个形状,它不可套利,在数学上,在一个高维空间里运动必须满足一些强约束、无套利约束,这使得它在低维的情况下呈现出可学习的规律。这个场景实际上很容易被一个深度学习模型来学习。在所有的利率期限结构研究方法中,闫红蕾和张自力(2018)是第一个用人工智能方法来做贡献的。目前来看,这只是一个简单的神经网络的介绍,但利用神经网络学习出来的中国国债的利率曲线,比目前所有的方法都能获得更好的精度和定价准确性。不仅能够拟合和模拟,而且能够预测,用预测来做定价,这是一个比较新颖的方法。实际上,国债市场定价还不是很有效,存在许多交易机会和做市的机会。这个模型对国债做市非常有用,目前也将它扩大到其他债券,包括国债、国开债等高信用、流动性比较好的债,都可以精确地定价。
(二)AI在大宗商品的应用
我们研究了在大宗商品中的一个深度学习模型和组合管理方法。这是一个在相对没有趋势的情况下,也能够获得比较好收益的策略。我们首先从海量数据中提取影响商品期货趋势变化的关键性特征,将这些特征降维处理后,再交给特定的深度学习模型中训练,采用训练好的模型对趋势进行预判,进而根据预判结果制定投资策略。利用AI预判市场趋势的优势在于,它可以同时处理海量信息。我们持续跟踪了AI投资策略在黄金期货和白银期货上的业绩表现,发现AI策略是具有很大潜力的。
(三)AI在衍生品定价的应用
我们也是在金融行业中第一个把深度学习和注意力机制用在指数期权定价方面的。谷歌提出的注意力模型,模拟了人类视觉注意力系统,人类视觉在看东西时,通过快速扫描全局图像,很快获得感兴趣的目标区域,然后对这一区域投入更多的注意力。我们已将注意力融入深度学习,发现它可以大幅提升深度神经网络的预测性能。目前,我们已成功将这项技术用于期权波动率曲面的预测,进而更好地对期权进行定价和投资。
(四)神经网络在因子风险模型的应用
因子风险模型已经发展的相对成熟,但是我们在这方面仍有一些新的创新,就是在多因子模型的结构中,除了共性因子,再加一个个性因子,也就是股票的特质风险。在行业中,大家重点研究共性因子,很少人研究特质风险。因为从组合管理人的角度来看,如果持有股票50个以上或者几百个,共性风险更重要,特质风险可以被分散化。但是在某一种状况下,比如集中持仓小股票,或者给每个股票的风险打分,给它的预期收益打分的话,研究每个个股的风险其实非常重要。研究特质风险,可以利用神经网络的优势,因为这是一个数据挖掘的过程。长短记忆网络在这种环境下非常有用,而且提供了一套非常好的开放框架,可以增加互联网舆情数据等新的数据。像个股波动性这种复杂的、既有波动又有规则性的东西,目前所有的风险模型都不研究,都认为可以分散掉。但如果要真正了解市场,对单个股票的研究必须是非常深入的,像这样的复杂过程,现有的模型,比如GARCH模型都不能够抓住这些特征。
(四)大数据在投资者情绪等方面的应用
我们用自然语言处理方法研究了投资者情绪,主要针对财经新闻、产业链新闻进行分析,采用比较先进的谷歌的BERT算法,对每一条新闻进行情绪分类,然后再做一个指数来分析投资者情绪。我们也研究了专利大数据,将专利文本提取出来,对所有公司的专利进行研究,研究专利的价值溢出效应是怎么体现在股价上面的,这是寻找阿尔法来源的一个新的方法。