技术应用Application从数据资产角度看模型全流程管理文Ⅱ中国光大银行信息科技部李成我们首先要对模型及其周边概念进行清晰界定,以便能够清楚地说明问题并有助于讨论和后续管理实践。从国内外监管出发,我们对其定义如下。模型定义:本质上是一个函数,在一定的业务场景下,模型从输入通过函数式计算逻辑得到定量的结果。模型可通过算法训练得到或由专家规则确定,在训练完成或由专家生成固定模型的参数后,再经过验证、评审,部署于模型运行管理平台。部署的模型具有稳定的计算逻辑、客观性的解释说明、适用范围等属性。模型运行于模型运行管理平台。李成特征定义:模型的输入字段。为了能中国光大银行数据资产管理部技术专家,智能够更好地沉淀特征知识,提高特征复用率,服务团队主管,曾负责客户画像、权益平台、数据科学实验室平台、特征平台、模型运行管理平台等多个系统的建设工作。金融科技领域工作经验丰富,曾发表《从科技角度看模型风险管理》等文章。率。特征一般具有客观性、量化性的特点。特征加工位于特征平台,成为模型运行在列维度的输入。策略定义:业务场景下进行的决策及其决策逻辑,对应着真实业务行为。业务人员根据实际的业务需求在决策引擎上频繁地进行策略调整来实现业务目标。相较于模型来说其具有动态性、主观性,对应着业务行为,在系统上对应着策略平台/中台。如客群筛选(筛选后调用模型预测),根据模型结果进行触达,往往基于对模型的输入输出进行裁剪,并付诸行动。策略运行于各策略平台。算法定义:狭义的描述性定义是逻辑回归、XGBOOST、神经网络、聚类、协特征的易变动的个性化加工逻辑归属于模同过滤等,用于生产成模型,类似协同过型(例如:特征的分箱加工会沉淀在模型滤,其本身确定参数后即成为模型。无落中)。从而保证特征平台的特征具备稳定地实体。的加工口径、无歧义的业务含义和高复用标签:标签的定义往往最宽泛,在管理流程测试环境模型需求如今,用机器学习、数据智能代替人进行预测和自动化决策已越来越普及。但随着其在金融业的深入发展与广泛应用,带来的风险也开始逐步暴露。为此,银保监会发布的《银行业保险业数字化转型指导意见》中提到,要进行模型的全流程管理与风险管理。本文以中国光大银行为例,着重阐述如何进行模型全流程管理。模型、策略、算法、特征的定义为了清晰地阐述模型的全流程管理,模型独立评审验证数据科学模型四要囊模型(未评实验室上传图1模型开发上线管理流程模...