孙宇熙 Ultipa图数据库创始人及CEO
今天的分享内容是图计算穿透式精准计量,主要分为三部分。第一部分是通过举一些具体的例子来介绍图计算的相关原理;第二部分是图计算在银行流动性风险管理当中的应用;第三部分为图计算在其他金融风险管理当中的应用发展空间。
图计算的“图”,既不是图片的“图”,也不是图画的“图”,而是源于数学概念中的“图论”。从现代科学的角度来看,图计算最早源起于1736年,29岁的欧拉向圣彼得堡科学院递交了《哥尼斯堡的七座桥》论文,自此开创了数学的一个新的分支——图论与几何拓扑。
20世纪60年代左右,两位匈牙利数学家建立了随机图理论,随机图理论也一直是研究复杂网络的基本理论。也是从彼时开始,图论由纸上谈兵转为大量的实际应用和突破,比如地图染色算法、最短、最优路径计算,动态规划,社区识别等各类图算法等。
图计算中最基本的两种搜索是BFS和DFS,前者代表广度优先的搜索,后者代表深度优先的搜索。图计算可以实现:关联关系查询,影响力计算,网络化计算,模式识别,社区识别,量化计算等;具体到业务当中可以实现:行为模式查询,实控人查询,风险穿透与计算,流动性风险,资债管理,营销、预测、特征工程等。
以风险穿透为例,想要寻找一个集团最终的实控人,用关系型查询语言(SQL)需两百多条代码,而使用UQL/GQL图查询语言只需一条代码即可,且查询时间为毫秒级,让搜索和执行效率陡增。因此,UQL/GQL图查询语言更善于深度关联与穿透计算,无论是体现在速度还是深度上都具备着绝对优势。
“图数据库”兼顾图计算与图存储,是一种新型的利用多维度数据建模的数据库。虽然“图计算”与“图数据库”之间存在着一些不同,但在很多情况下,“图计算”可以和“图数据库”混用、通用。
图数据库对于关联查询、穿透查询、动态数据处理、异构数据处理、海量数据处理、无模式、多模式数据等多方面均优于传统关系型数据库。
从市场维度看,对于图数据库、图分析、图计算需求都在高速增长。实际应用中,图计算协助美国CIA情报分析找到了本拉登;该技术还协助银行找回麦道夫的庞氏骗局隐匿了20年的资金。
图计算应用于金融网络场景是较为复杂的,解释如下:第一,区别于互联网金融场景是一种短链条计算,传统的金融场景则是长链条计算,这就要求在技术实现上所定的规则更为复杂,涉及到追溯、回源、归因,而且数据的计算量更大,同时也更注重时效性,算法也更为复杂。第二,互联网金融要求三维数据计算,此时再使用传统金融场景的二维运算,是非常不便捷的。
流动性风险管理图计算(图中台)系统在技术侧通过底层的实时图算力、高可视化、白盒实时回溯等性能,能实现逐笔金融风险的科学计量、深度下钻与穿透。此外,我们通过交互三维可视化的方式,可以清晰看到LCR的贡献度的变化和分析,同时可以从分行的维度做实时分析,从行业的地域维度做实时分析,还可以反向追溯LCR变化的因素等。此前招行荣获2021年度《亚洲银行家》唯一流动性风险管理奖项,我们有幸参与了其的流动性风险图中台系统建设。
“图中台”在进行流动性风险管理时能够实现重要突破,具体体现为以下六点:能够以实时交互的方式实现可视化全景数据;用非常小的计算集群,同时达到高密度计算;实现超强算力,速度快1万倍,性能得到极大提高;精准计量账户里的每一份钱;进行超深度分析,追溯到每笔交易;实时计算LCR及变化原因。值得一提的是,不同的图计算(图数据库)产品的性能是千差万别的,只有真正实现底层创新的图技术才能赋能到金融业务。
区别于过去银行使用以传统数据库系统长期存在的“时效差,算的慢”、“黑盒化,算不准”、“粗糙计量,算不精”、“成本高,算的贵”带给业务侧的一系列痛点,Ultipa实时图计算(图数据库)实现了算力、算法、合规、成本、穿透计量五个维度的创新:实时掌握LCR变化,提前预知风险,完成监管需求;实时可追溯功能,精准定位传导路径;各类LCR贡献度变化,实时调整行内业务决策;实时模拟计算系统,帮助制定业务规则;白盒透明,可视化管理计算细节;逐笔计量、穿透,客户级LCR贡献度计算,掌握细节。旨在能满足与银行实际业务贴近的诉求和与金融市场与时俱进的发展要求。
从监管角度看,有三大计量工具,即缺口分析、监管指标和压力测试。而从流动性缺口分析到流动性压力测试,最终集大成的还是流动性覆盖率(LCR)这个指标,且计算起来是非常复杂的。比如一个大型商业银行,它是基于全行数据的一次计算,其中包括存贷款、零售、对公、同业等全量的、数以亿级的海量数据进行计算,且数据量还是覆盖30天的,那么它的数据计量已达到近百亿级,这是非常考验底层系统性能的承压能力的。
图计算在助力金融机构进行流动性管理上发挥了有效的作用,与此同时,在其他金融风险管理中也具有非常广泛的应用。例如,图计算能够实现股权穿透,识别深层次的隐形集团;能够实现信用风险传导概率的计算和路径分析;能够进行风险识别预警,构造风险传导的计算,构造交易、担保链图谱,可以推导出哪些企业具有较高风险、涉嫌欺诈,从而更好地让业务部门及时做预判,进行止损;还有优化集团产业链挖掘、营销路径,分析资金流向、在线实时反欺诈等等。高性能图计算就是要通过高密度并发、深度穿透、动态剪枝等能力去充分地释放底层硬件的算力,旨在让应用层充分获取到底层的计算资源,最终赋能银行在业务上实现安全性、盈利性和流动性“三性”之间的平衡,同时做到防患未然并运筹帷幄的作用。
总结来说,实时图计算和图数据库具备三大特点。第一,相比于传统的数据库,其计算效率和性能是成千上万倍地显著提升;第二,业务部门更加在意白盒化,即用一种可解释、能追溯、能回源、能归因的方式进行可视化的管理计算细节;第三,符合我国战略方向,体现“碳中和”——运用更少的计算资源和更低的碳排放来实现大指标的全面计算与穿透。
(责任编辑:王琦)
来源:TGES2021高级研讨会:资产负债管理与流动性风险管理高级研讨会(8月)