AI正使投资管理人员改进或变更其差异化的核心能力,以适应新的商业模式,AI将会促进或加速投资管理行业的诸多变化。基于历史数据和统计规律的大数据分析本质是归纳法,大数据和人工智能的本质都是从历史数据提取规律,从而预测未来,但预测能力取决于输入数据的质量。金融科技与投资结合,机会主要来自于应用场景的挖掘和改造,技术必须适用于应用场景。目前AI缺乏直接的因果关系检验。在投资管理中,AI的应用不是不能做,而要从简单到复杂。
AI这两三年有突飞猛进的进展,改变了投资的方法,非常有必要掌握AI这种工具作为核心竞争力。AI赋能的重点领域为财务咨询、量化投资和财富管理等。
(一)在财务咨询方面,AI会增强和扩展财务咨询的能力和范围。因为大数据对客户具有精准的了解,过去打包式的产品形态会发生很大的变化,未来可以做到千人千面的个性化的打包方法,提高效率并且用更低费用完成投资流程。
(二)在量化投资方面,量化的一个重要标志就是可以用低成本来做大量的研究,有了AI以后,不只是低成本、高效率,还能够做到定制化、千人千面,所以在商业模式上有很大的赋能。
(三)在财富管理方面,AI可以覆盖更多的新兴市场和低收入人群,提供低成本的获客能力,用科技的方法来给低收入的人群做财富管理。传统的资产管理主要是针对高净值客户,普惠金融可以通过AI来驱动, AI、大数据、云计算等技术会使得财富行业有非常大的扩展空间,追求超额收益的套利交易会进入新的层面。
很多过去我们处理不了的、效率很低的策略,可以在新的框架中得到更多发展,更高级的数据科学和更广泛的数据源都在给我们赋能。
人工智能的本质还是归纳,是一个具有超强算力的统计工具,它的本质是从历史数据中提取规律并预测未来。除了数据质量的问题以外,它本身还存在许多问题,比如可解释性、黑箱方法、过度拟合等,这是AI受到的主要批评。因此,AI要和实际场景结合,要在相关性和因果关系中间进行平衡,然后去突破AI投资的黑箱性质。目前,AI缺乏直接的因果关系检测,使用历史数据做信用模型的,可能对这方面不是那么讲究。但是在投资上,这是非常重要的,包括变量在建模过程的互相依赖性,尤其是时间持续性的检测,有没有自变量可以被其他自变量解释。实际上,这些测量在目前的算法里都是没有的,这也是目前AI的弱势。
在伊曼努尔·康德的研究中,认为因果律不能来自于经验,而AI的判断大部分都来自于经验。卡尔·波普尔认为,归纳法不能给人类带来必然的知识,所以科学投资、理性投资实际上是有局限性的。索罗斯说金融市场的本质是不确定性,这种不确定性是根本的、是绝对的,任何知识都是可能被证伪的。所以在运用AI时,一定要有所警示,投资策略是不是仅自己认为有效,这是非常重要的。
AI的缺陷不意味着AI不能做投资研究,在一些好的场景,选取正确的投资工具的时候是可以的。比如,在因素相对比较简单、驱动因子可以简化的情况下,AI可以做投资,包括在高频交易、市场中性模型、短期套利策略等情景下,AI可以发挥强大的优势。
我们认为利率曲线的运动反映了市场投资者的博弈结果并且包含着规律,那么利率曲线,尤其是国债的无风险利率曲线,是可以被学习和预测的,而利率曲线是所有利率产品,包括衍生品的定价基础。利率曲线之所以能够被学习,是因为利率曲线本身有一个规律,不会随机地取一个形状,它不可套利,在数学上,在一个高维空间里运动必须满足一些强约束、无套利约束,这使得它在低维的情况下呈现出可学习的规律。这个场景实际上很容易被一个深度学习模型来学习。
用预测来做定价,这是一个比较新颖的方法。实际上,国债市场定价还不是很有效,存在许多交易机会和做市的机会。这个模型对国债做市非常有用,目前也将它扩大到其他债券,包括国债、国开债等高信用、流动性比较好的债券,都可以精确地定价。
我们首先从海量数据中提取影响商品期货趋势变化的关键性特征,将这些特征降维处理后,再交给特定的深度学习模型中训练,采用训练好的模型对趋势进行预判,进而根据预判结果制定投资策略。利用AI预判市场趋势的优势在于,它可以同时处理海量信息。我们持续跟踪了AI投资策略在黄金期货和白银期货上的业绩表现,发现AI策略是具有很大潜力的。
我们也是在金融行业中第一个把深度学习和注意力机制用在指数期权定价方面的。谷歌提出的注意力模型,模拟了人类视觉注意力系统,人类视觉在看东西时,通过快速扫描全局图像,很快获得感兴趣的目标区域,然后对这一区域投入更多的注意力。我们已将注意力融入深度学习,发现它可以大幅提升深度神经网络的预测性能。目前,我们已成功将这项技术用于期权波动率曲面的预测,进而更好地对期权进行定价和投资。
因子风险模型已经发展的相对成熟,但是我们在这方面仍有一些新的创新,就是在多因子模型的结构中,除了共性因子,再加一个个性因子,也就是股票的特质风险。在某一种状况下,比如集中持仓小股票,或者给每个股票的风险打分,给它的预期收益打分的话,研究每个个股的风险其实非常重要。研究特质风险,可以利用神经网络的优势,因为这是一个数据挖掘的过程。长短记忆网络在这种环境下非常有用,而且提供了一套非常好的开放框架,可以增加互联网舆情数据等新的数据。像个股波动性这种复杂的、既有波动又有规则性的东西,目前所有的风险模型都不研究,都认为可以分散掉。但如果要真正了解市场,对单个股票的研究必须是非常深入的,像这样的复杂过程,现有的模型,比如GARCH模型都不能够抓住这些特征。
我们用自然语言处理方法研究了投资者情绪,主要针对财经新闻、产业链新闻进行分析,采用比较先进的谷歌的BERT算法,对每一条新闻进行情绪分类,然后再做一个指数来分析投资者情绪。我们也研究了专利大数据,将专利文本提取出来,对所有公司的专利进行研究,研究专利的价值溢出效应是怎么体现在股价上面的,这是寻找阿尔法来源的一个新的方法。
来源:2019TGES金融AI、数据管理与风险管理高级研讨会(5月)-张自力 《关于Al投研的实践与思考》