袁先智 中山大学管理学院特聘教授,数联铭品科技有限公司(BBD)高级副总裁兼首席风险官
1911年熊彼特提出了经济发展理论,而110年后的现在,他的理论描述的社会或企业的发展,在实际中有了更加创新的概念。一百年里一直有人尝试挑战他,试图用数学模型表达经济发展理论。同时,对什么因素决定了企业能不能成长的研究,不断探索解决方案。我们在本报告与大家分享,怎样利用大数据方法筛选特征来刻画中小企业,回答熊彼特110年前的经济挑战,建立比较系统的数理框架。
人类在过去针对经济发展理论的研究和描述,基本上都是建立在经济学传统的效用函数作为基本的工具展开的, 但效用函数这个工具显然已经逐渐过时了。 在中小微企业这个特殊的实体种类,从大变中变小的过程里,个人意识行为和财务能力紧密相连,效用函数不能完全解释个人和企业的行为。因此在大数据的情况下,当传统的结构化数据(比如财务的)不够时,可以利用大数据的非结构化数据处理,能够解决部分信息不够和不对称的问题, 当然也有一个数据融合的过程, 但同时, 更需要创造出新的工具进行分析。通过我们过去5到7年的探索, 建立了基于大数据融合的称为全息画像的分析工具,期待完成下面的工作:如果只用基本的公开数据,不需要授权数据,不需要机密数据,也不需要全面的数据,就针对企业进行基于企业特征的刻画?我们说,这个全息画像的分析工具的核心是用基本的15% 到20%的公开信息搭建基本的分析框架,在授权的其他数据的特别情况下,对场景和涉及到的问题有更深更广更一般的解决方案。
具体实施过程是首先利用全息画像工具对数据进行处理,形成对场景的解读,结合大数据分析,根据具体场景分析该方法的突破。对一个公司来说,公开的基本数据就是公司的管理者和公司的投资者,他们构成公司可以形成关联方的关系。在传统的没有大数据的时代,或者全球化出现前,分析者总希望把投资人、红利、新闻放到一边,管理层放到另一边,但这样分类存在问题,如果把两部分加总,只是关联关系物理的整合,而没有形成关联关系的化学反应。因为只有同时二元考虑,比如A和B有投资关系和管理关系,B和C有投资关系和管理关系,A和C也有了间接关系,两两交叉互相联系才能形成有效的基于关联关系的化学反应。
有了非结构化数据的交叉分析,下一步需要找到隐藏在画像背后的东西。最简单的一个例子是定义出来的点形成的网络结构,可以解决金融问题。对一个实体行业,比如对小微企业中的制造小微,零售和金融服务的结构有1度,2度,3度等,相比于其他服务类行业有明显的不同。这要求在整合数据时有处理非结构化数据的方法,否则难以把握小微企业的多层结构。在创新了这个方法后,我们迄今为止已经合作了40多家中小型银行,其中4~5家贡献了400多个亿,年化不良率已经低于2%了,是非常卓越的成就。
相比于传统做法,在只利用公开数据构建分析模型的情况下,基于大数据的新方法可以在较缺少部分信息的情况下通过全息画像得到需要的“关联方”。在服务小微企业的具体场景中,需要的政府数据、银行数据的70%~80%由政府掌握,可以利用具体数据具体分析。如果只考虑公开的数据,有些数据单独来看可能没有很大的解释能力,但是只有和授权的数据搭配, 就能够形成真正的解决方案。在反欺诈问题上,一般是先评估后贷款,如果出现违约再执行反欺诈程序。所以反欺诈是中台和后台的事情,而不是前台的工作。
熊彼特认为人类的发展或经济的发展,基于小微企业的发展,小微企业发展来于创新技术。我们的新方法类似于基于特征提取的化学变化,公式发展和变化就是对应的资本和技术之间的反应;结合内部外部的投资+内部和外部的风险,就得到了公司的发展演绎转化,这回答了熊彼特理论中小公司发展的技术与资本转换的数理表达形式。
总结来说,小公司的发展受到投资人和管理人等关联方的影响,这就是共振。
基于优选的“U型”现象的新理论是核心突破点之一:小微企业投资方并不是越多越好。这个理论解释了在一般情况下,投资方是3~7个人,一旦超过9个人就形成了负面影响。这个发现和诺贝尔奖的共振理论本质是相通的,从无序到有序。这解释了小微企业中技术和资本的转化,同时阐述了投资方和管理方的随机共振现象。
第二个突破点是从理论上证明能从小企业成长为大企业一般不超过1/3。同时,从小微企业高层到大企业都存在欺诈。应对欺诈的方法是测试公司的管理资质,从信用评级角度,以违约概念为基础,包括违约举证、违约样本等等形成一套规范体系。利用这个体系,我们第一次成功分解了不同公司的信用资质。利用三因子或者五因子模型进行对应的阿尔法分解,可以发现AA以上比一个A好,一个A的信用等级的实体比三个BBB的好!
第三个突破点是成功用非结构化数据构建了针对公司信用评估需要的20%左右的“坏样本”。在这个方面我们得到了两个方面的结论: 第一个结论是现在与传统相比本质没有多少变化,公司治理中董监高治理框架仍然存在,很多独立董事可能本身没有专业知识,后续发展一定是会走人的; 第二, 如果董监高与股权结构连在一起,会引发出基于非结构化的风险特征, 可以描述刻画欺诈的行为,和预防的机制。基于以上的研究,我们形成了对中国9500家公司的评级, 其中4800家是上市公司,另外有2500家地方城投,另外还有2500家是其它发债的公司。
回到小微企业,必须意识到一个问题,在任何制度任何国家情况下小微企业的成长都是很困难的,理论上已经证明了不会超过1/3的小企业能够成长成为大型企业了,和制度没有关系。
通过三年左右的时间,我们写了一本书 (其实是一把教材),书名为《金融科技大数据》,由清华大学出版社在2021年底出版,其中建立了针对非结构化关联因素在大数据框架下的风险特征提前分析标准。如果只是基于传统的统计学的推断理论,对大数据分析就缺少判断标准,对特征提取会非常困难。我们在分析框架中对通过引进“高度关联”这个新概念并进行了分类处理,相比于因果关系的推断解释要求会低一点,但是比传统统计学推断中的相关系数要高,这是一个新的突破。针对整个中小型企业(非结构化数据的)的特征分析和提取在另外一本金融科技的教课书中有系统的描述,我们也进行了全面的叙述。
最后再跟大家分享一点,也是我们的第4个创新点。中国在2020年消除了绝对贫困,接下来要继续精准扶贫。怎么用大数据的方法实现精准扶贫呢?在每一个省, 针对扶贫人口的刻画有100多个指标,其实这100多个指标不可能来实现精准建模,所以我们采用了大数据的分析方法,去结果是只要12个指标可以构建对农村贫困客户的刻画,并可称为实现振兴乡村和农村信用评级最核心最基本的一个方法,我们是目前解决这个问题的。这个方法非常关键,是支持农村信用建设的核心,这也是支持和落实普惠金融中间的一个重要部分。
整理人:田程依一
责任编辑:傅泽天
来源:TGES2021(第十七届)中国金融风险经理年度总论坛:小微普惠金融与风险管理(二)(11月)