蒋亚萍 毕马威独立顾问、iModX首席风险官
数据和模型是风险管理中的两大重要元素,在风险管理中如何合理地运用数据和建立模型尤为重要。本文主要基于数据与模型的生命周期和区块链技术,来谈一谈数据和模型管理的数字化转型。
数据的生命周期有五大关键阶段,分别是数据采集提取、数据处理、数据验证、数据维护和数据储存。
在数据采集之后,需要对数据进行一定的处理,比如补充数据中的缺失值和数据的格式化。
在数据的验证过程中,首先要根据业务需求和模型开发的要求,来考察数据是否满足相关的要求,即数据是否完备,准确及具有代表性。另外还要验证数据的实用性、稳定性和及时性。数据验证过程完成后,才可以把数据输入操作系统,并运用数据来建立模型或者用于其他的分析。
数据的维护包括几个方面:数据必须随时间推移不断地更新;原始的数据必须要有备份,以预防原有数据丢失;对数据需要进行定期复查,利用多维的数据重新验证数据的正确性;此外,对于数据的访问控制,需要有内部控制措施来控制访问和更改权限,并保证有文件来记录数据的更改。
最后一个阶段是数据的储存和保留,需要建立数据库来保存数据,并根据实际需要确定数据需要保存的时间。
模型的生命周期包括八大关键阶段,第一阶段是模型开发和启动,第二阶段是数据的采集,第三阶段是模型开发。第二阶段和第三阶段可以同时进行,也可以有先后顺序。模型开发阶段对模型的选择,方法假设,测试结果等要有详细的文件。
模型开发完之后,进入第四个阶段,即模型的验证和审批。需要注意的是,模型的开发和模型的验证审批过程必须是独立的。从模型风险管理角度而言,模型开发属于三道防线中的第一道防线,模型的验证和审批是第二道防线。在模型的审批和验证过程中,要对模型预定的使用范围进行有针对性的独立测试,并考察模型实施程序的稳定性和鉴别模型有无缺陷。经过审批通过后,模型才能最终进入到第五阶段即应用系统的实施。模型生命周期的第六个阶段涉及到模型的维护和使用。模型的维护和使用与数据的维护和使用类似,要有严格的模型访问控制和更改控制。
在模型开始使用之后,还需要进行持续的监控,观察在市场条件或经济环境变化的情况下,模型是否还能有效的运作,这是第七个阶段。如果在运作过程中发现了问题,对于小的问题,可以在原有模型的基础上进行修改,但若出现较大的问题,可能需要开发新的模型去取代旧的模型, 旧模型随之退役, 这就是模型生命周期的最后一个阶段。
现在金融机构的数据和模型基本都是各自分别单一管理的,很少有共享的情况。而在每个金融机构中,数据和模型可能存在于多个系统中进行分散管理。在这种情况下,数据和模型的互联和相关性很难检测。同时,许多常见的数据和模型管理过程在不同的金融机构里重复实施,每个金融机构花费了大量的资源用于模型和数据管理,这对于中小型的金融机构而言是个不小的挑战。此外,由于不同金融机构所用的数据、方法、标准和模型都存在着差异,同一类产品可能会出现不同的测评结果,导致标杆分析和跨部门审查等面临的挑战不断增加。
基于区块链技术和管理平台,可以实现模型和数据的民主化管理,驱动数据和模型的数字化转型。通过区块链,可以把每一类数据和模型作为单独的区块储存到区块链的平台上,对每一块数据和模型进行单独分散的管理。根据数据私密性的不同,可以把数据分为外部数据和私有数据两大块。外部数据包括常用的市场数据,政府数据、经济数据等,可从公共资源或数据供应商处获取。对于私有数据,数据拥有者可以上传到区块链平台上,平台通过设置密钥的方式来保护数据的私密性和设置控制访问的权限,未经数据拥有者许可和授权的用户无法访问具有密钥的区块链数据。私有数据在区块链平台上授权使用的通常是脱敏数据。
存储在区块链平台上的数据块和开发的模型,通过合格的验证者在平台上进行验证后,平台发布标准统一的验证报告。从审计部门和监管部门的角度而言,可以直接审查数据和模型的验证报告,以是否通过审批为原则来验证模型。
区块链平台的一大特点就是每一个模型和数据的提供者都拥有私钥,数据和模型是作为一个加密的智能合约输入到终端的用户系统。区块链的平台根据用户每次使用的区域收费,这就意味着对于用户公司而言,只为使用的数据和模型付费,而并非需要为整个平台来付费。并且,在区块链平台上,所有的使用和更改都有严格的记录和验证,使得数据的安全性和模型的一致性大幅提高, 而且可以快速跟踪数据和模型间的关联性。这样一来,整个行业对数据和模型生命周期活动控制的付出就将大幅减少,资源可以转向于应用的设计和内部系统的完善。
在区块链平台上,数据和模型都成了商品,使用者使用数据和模型必须支付使用费。这些使用费的利润会分配给数据提供者、模型的开发者以及数据和模型的验证者,从而使这些数据和模型的开发部门,从一个不产生利润的纯服务部门,转变成了一个利润生成的部门, 这样有利于激发这些开发部门的积极性,提高数据的模型的质量。此外,在区块链平台上,各家机构使用同样的模型和数据,可以使得模型和数据变得一致和透明。
(责任编辑:曾祥瑞)
来源:TGES2021高级研讨会:资本、风险偏好和限额管理(8月)