金祖胜 Bunker Hill保险公司分析部负责人
预测模型在商务决策的各个方面都有着广泛的运用,简单而言,预测模型其实就是一个函数,通过预测变量x,来得到目标变量y。我们搭建预测模型的目的其实就是想在未来已知预测变量x但不知道目标变量y的情况下,通过x来预测y,帮助我们做出决策。
模型应用的过程,其实就是商务决策的过程。举例来说,如果利用模型进行精准营销,那么可能就要预测哪类客户会对产品感兴趣;风险控制模型则是一个决策问题,最终要决策是否通过这个项目。
预测模型的应用场景很广泛。以保险行业为例,我们针对潜在客户建立了响应模型、风险模型和终身价值模型,用户只要访问我们的网站,就可以在短时间内完成定价。这就是一种预处理,通过数据和模型实现精准营销;而对于使用商业模型的商业保险而言,每年平均只有50%的投保能够处理,那么就需要建立一个模型来决定什么样的投保我们能够处理。模型的基础当然还是终身价值模型,但在模型的特征上有一定的变化,由于从潜在客户所获得的预测变量信息较少,需要对终身价值模型进行一定的调整;此外,包括定价模型、理赔模型、续签的风险模型都是预测模型在保险行业中的应用。可以说,在保险业务的生命周期中,每一个阶段都能用得上预测模型。
预测模型的方法中最常用的是逻辑回归的方法,决策树方法也有一定的运用,生存分析目前也用得比较多。在确定终身价值时就要去做生存分析,确定存活时间以及在未来的每个阶段出现的风险的可能性是多少,再利用未来现金流折现的方式进行价值分析。
现在用得比较多的是神经网络和深度学习,基本在云上运作。混合模型的运用也比较广泛,比如在做市场营销组合的时候,如何优化市场的渠道,怎么合理分配年度市场的花销,这一部分的业务主要用混合模型建模。
模型设计是模型搭建过程的第一个环节也是最重要的一个环节。建立模型的过程其实和建一栋房子类似,如果图纸做得不好,后面再怎么优化,也不可能建立一个很好的模型。模型设计不但要考虑模型未来怎么使用,未来的系统如何搭建,还要考虑历史样本怎么选择、目标变量怎么确定、有哪些可用的预测变量。此外,还需要考虑模型在线上的具体实施是由IT部门负责,还是由自己的部门负责。如果模型基本由IT部门负责,就需要提前和IT部门进行交流,让他们去实施线上的铺垫。这样建立好模型之后,模型就能快速地投入线上使用。
对于建模人员而言,模型设计最重要的有三个要素。第一个是因变量,即目标变量的定义,需要结合实际的问题来定义目标变量,并考虑包括观测期长度等细节,因变量的定义最后会影响样本的选择。第二个要素就是样本,统计模型是以样本来估计总体,需要考虑如何解决样本的偏差问题,以及样本能否代表将来的总体。第三个因素就是特征的选择,要考虑什么样的特征更具有预测性。
变量的筛选是模型建立过程中很重要的一步,可以通过监督学习和非监督学习(比如聚类分析和主成分分析)的方法去筛选目标变量。变量经过筛选之后,还要进行一定的处理,使得变量与目标变量之间的关系更加线性化。同时,为了使模型更加稳健,不会因为个体的变化受到巨大的影响,需要对数据进行上下限的处理。同时,对于字符变量,可以通过标签等分类的方式进行数值化的处理。
现在的模型有很多,包括机器学习、深度学习等,需要决定的模型具体参数也很多。比如对于决策树模型,要决定树的深度,树的枝叶是否需要保留,什么情况下需要分枝,达到什么样的条件需要剪枝。不同的参数会形成不同的模型,再把这些模型进行组合叠加,又能组合成新的模型。
在模型的优化方面,我们一般采用双变量提升图的方式。即新模型和旧模型进行比较,通过双变量图展现除模型之间的差异,再进行判断和决策。具体而言就是观测训练集上的分布点和分割点,然后运用现有生产线上的数据去评价模型的预测效果来支持各种商务决策。
(责任编辑:曾祥瑞)
来源:TGES2021高级研讨会:资本、风险偏好和限额管理(8月)