在当前我国强监管的背景下,当前经济形势面临不确定性的挑战,主要有两个方面:一方面,在所谓的去杠杆背景下,风险防范方面的监管指引措施给金融科技带来了挑战。另一方面,最近又出台了一些新的监管指引,这些监管措施对风险管理,对金融科技提出了新的要求和挑战。
在金融科技方面,“产融知识图谱”能够有效地整合数据进行风险防范。其中包含四个关键词:第一个是产业云图,能够建立生态视角,提供从企业内外关系角度分析问题的能力,包括企业间关系、企业内部经济要素、企业和行业、企业和客户、企业和市场价格等要素的关联传导;第二个是金融工具,包括信贷、投资、保理等金融产品,所需要的评级、定价、获客、价值评估等手段;第三个是大数据,帮助构建和丰富产业云图,完成从原始信息到企业关系、风险特征、风险事件的提取和整合;第四个是知识图谱+机器学习,帮助提炼产业云图下隐含的规则,建立知识网络、预测模型,实现风险识别、传导和预测的能力。
产融知识图谱需要与人工智能相关的技术进行匹配。首先是图谱构建,将图计算、风险传导等复杂网络技术在知识图谱中聚合。其次,大数据量化方面,要将大数据的技术融合进来。第三,在机器学习领域,要做更好的知识推理,把深度学习、遗传学习、集成学习的方法运用到不同的金融场景。
以风险场景为例看AI技术的应用历程。早期的AI公司通过图像语音识别等感知场景去提升业务,但风险管理是一个知识密集型的领域,需要通过知识图谱和相关的不同AI技术的集成来综合解决不同场景下的问题,所以风险管理技术的演进与AI技术的演进是对应的。从打分卡到内评法,到巴塞尔协议,是十年间的建设热点,对应着BI(商业智能);现在是以图谱技术为支撑的新一代模型技术阶段,对应着AI(人工智能),在这期间国内一些领先的金融机构也纷纷进入到这个体系建设的进程中。
对建模时代做一个划分。首先是风险管理的匠人时代;AI时代来临以后,进入到风险管理的工业时代;在工业时代,“模型工厂”能够帮助快速建立新一代的风险模型。在模型工厂的构架中,最下面是数据工厂,数据工厂中不再只是企业内部的结构化数据,还融合了更多的外部非结构化数据。
模型工厂的中心是人工智能,融合了知识图谱、机器学习、复杂网络、自然语言处理等来自于不同领域的AI技术,从而变成了一个综合的AI引擎。需要注意的是,在这个引擎下,要把关注点放到其他配件上,这些配件才是完善高质量模型的更重要组成部分。第一个配件是产业云图,即如何站在生态视角看个体的体现,包括客户谱系和产业谱系,其中产业谱系是更大范围的一个族谱,也是风险传导更加关键的一个路径。第二个配件是金融工具,即深度画像和智能报告等技术的体验。深度画像是指把原来非结构化的信息提炼成为结构化的金融事件,基于这些事件构建出动态的画像。
在产业云图和金融工具之下,是知识仓库体系,包括实体库、特征库、事件库、标签库等。只有通过知识仓库才能真正把内部原始数据和外部数据加工成一个模型需要输入的变量体系。
产业云图、人工智能、金融工具和知识仓库统称为智能工厂,这是生产高质量模型的配件和车床的部分。再往上是模型商店。在公司金融、小微金融、供应链金融、资产管理、零售金融等每个领域都有不同场景下的模型建设。从网络视角看个体风险,在每个客户进入到一个网络体系时,所有的传统模型都会被重新构建。
在模型工厂时代,通过人工智能,以及产业云图和金融工具两个配件的构建,能够对传统模型进行提升,进而拓展风险管理的新边界。这些新边界体现在以下四个方面。
第一,在广度方面,通过大数据和知识图谱构建网络,也就是利用网络视角看个体风险。
第二,在深度方面,风险特征、金融事件的分析会更加深入。在风险特征方面,传统风险体系信号模型特征选取只包括结构化风险因子,而新一代智能风控体系不仅包括结构性风险因子,还包括关联性风险因子和事件冲击下的传导性风险因子,通过新维度的风险因子构建,能够丰富构建模型的变量输入。在智能报告方面,自动生成Word分析报告,分析报告会对客户及其关联关系群(集团、系统)进行综合分析,极大提高报告生成速度,减少人工成本。
第三,在传导性方面,产业云图为风险传染构建了一个路径。通过有监督和无监督两类算法体系的构建来计量,当一个企业或者一个事件发生以后,它会沿着什么样的路径波及多大的范围,对相关成员的影响有多大。这里产生了一套新的网络算法体系——黎曼传导,它是基于非监督学习的方法体系,目前已在多家金融机构进行应用实测。
第四,在产业化方面,金融必须和实体产业进行深度的链接和融合。在模型工厂的体系下,通过知识图谱的方式,把原来供应链里碎片化的信息重新融合,构建新型的供应链金融风控和小微金融风控体系,与实体经济做更深度的链接。
以上包含了七项人工智能的技术应用,包括机器阅读、实体指纹、谱系算法、黎曼传导、寒武特征、协同预测以及机器速写技术的引入与构建,这七项技术共同支撑模型工厂的建立。所以,模型工厂是一个ABCK的融合,即人工智能、大数据、云服务和知识图谱技术的融合。 ABCK把外部数据和内部数据充分融合以后,形成所谓的冷启动库,也就是知识仓库体系,来加速构建模型的起点,不再从头去整合信息建立,而是从知识仓库的体系之上再去建立模型。在AI时代下,模型工厂为风险管理提供了一个新型的武器和工具。
来源:TGES2020前沿讲座系列-11:金融科技核心技术与应用《人工智能拓展风险管理新边界》演讲文稿整理
概括来讲,赋能的对象一端是产业,分为对公和对个人,他们需要的是精准的金融服务;另一端是金融,包括做信贷、做资管和做投资等繁多的金融业态,他们需要的是质地良好的资产。使这两端充分地连接就意味着两端都需要被赋能。
在知因智慧看来,赋能的手段就是产业知识图谱。首先将产业的要素识别出来,如集团内各企业间的关系;企业的担保链、供应链关系;企业和消费者之间的经济往来等都是产业知识图谱涵盖的范围。把这些依据于不同关系的形态链条打通,利用大数据定量描述,寻找他们的画像,再通过机器学习,计量他们之间的关系和影响,帮助金融机构更好地识别风险和获取客户。作为赋能的核心手段其涵盖大数据,人工智能,云服务,用知识图谱的方式呈现。其目的是把交易方的风险或商机显示出来,帮助金融机构判别,更好地了解交易对手,继而提升他们对产业的金融服务水平。另一方面,金融的本质就是通过风险进行获利,这个过程中被赋能的两端都是获益的。
产业知识图谱的数据分散在政府,金融市场,互联网,企业以及金融机构的内部,包括企业的工商数据、企业在金融市场的表现数据,与企业发生投资担保等重大关系的关联企业的数据以及金融机构的交易数据等。过去这些数据都是孤立的,由于数据可得性的不同,不同机构的数据使用者只能依靠某个领域的数据来做决策。产业知识图谱本身是网状的,是整合碎片化数据的有效手段。它把目前相对公开且没有法律问题的各类数据收集整合,再用知识图谱进行串联,使得这些数据不再是孤岛,呈现出更多的信息。
过去金融机构的做法是对数据进行简单的购买和整合,很难完整地识别;而除了数据本身,还要识别集团客户或系客户各种复杂的显性和隐性的规则和关系。如果金融机构不在全网和全量的企业数据中利用先进的手段分析,是无法得到完整的穿透性的链条,但是同样的数据经过产业知识图谱的处理就会产生不同的结果。
金融机构自我赋能存在很多壁垒,比如数据壁垒,规则和技术上的壁垒,业务壁垒等。对大型金融机构,会努力自建这个能力。但更多的金融机构需要的可能是一个拿来即用的产品,而不是从零开始研发。此时产业知识图谱是最好的手段,将信息关联性显性地呈现出来。
未来金融机构和金融科技公司一定是共生的关系。特别对中小金融机构,运营和复杂的工作由金融科技公司完成,之后输出给他们;另一方面,金融科技公司在与金融机构合作的过程中可以获得更多专业领域的知识,尤其是头部客户能够给金融科技公司带来极大的认知提升,实现双螺旋式的自我成长,彼此互建共生。
来源:AI赋能金融:知识图谱推动产融一体化——访知因智慧创始人任亮,中国金融新闻网,2018-05-25