分享
卷积神经网络在死亡率中的应用.pdf
下载文档

ID:2643363

大小:2.33MB

页数:3页

格式:PDF

时间:2023-08-20

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
卷积 神经网络 死亡率 中的 应用
信息通信卷积神经网络在死亡率中的应用张倩(南开大学金融学院,天津30 0 0 7 1)摘要:我国人口老龄化程度不断加深,长寿风险加大了养老体系的偿付压力,使我国经济发展面临危机和挑战。在寿险精算实务中,精准的预测死亡率可以降低不确定性风险给企业带来的潜在危害,是有效管理和量化长寿风险的关键。基于二维卷积神经网络的死亡率预测模型,可以发现死亡率数据之间潜在的非线性的结构,同时相较于其他神经网络模型其参数数量大大减少,可以在一定程度上避免出现过拟合。关键词:长寿风险;死亡率预测;二维卷积神经网络中图分类号:TP1831 引言近年来,世界人口死亡率正在逐渐降低,人均寿命不断提高,人口老龄化程度日益加深。国际上公认的老年人口年龄结构标准指出,6 5岁及以上人口占比大于7%时,就已进入老龄化社会。据有关数据显示,2 0 2 0 年中国6 5岁以上人口占比为13.5%,较2 0 10 年增长4.6 3%,2 0 2 1年中国6 5岁及以上的人口占比为14.2%,2 0 2 2 年末中国6 5岁及以上人口占比为14.9%,这说明我国人口老龄化呈加速趋势,社会人口呈现高龄化趋势。同时,随着我国适龄人口生育意愿的降低和老年人口的寿命不断延长提高,2 0 2 2 年末中国人口自然增长率首次出现了-0.6%的负增长,长寿风险已成为我国当前社会不容忽视的问题。长寿风险加大了养老体系的偿付压力,死亡率下降将会对社会养老保险和商业保险公司的偿付能力带来潜在的危害,使我国经济发展面临危机和挑战。对此,国家也出台了一系列应对长寿风险问题的政策,如2 月2 1日,国务院印发了“十四五”国家老龄事业发展和养老服务体系规划,明确提出要逐渐延迟法定退休年龄,同时,国家也十分重视人口发展问题,在鼓励生育方面出台了一系列政策,如三孩政策、单独二孩政策。而在保险精算领域,死亡率是寿险实务中产品定价和准备金评估的重要基础,精准的预测死亡率可以降低不确定性风险给企业带来的潜在危害,是有效管理和量化长寿风险的关键。因此,不断地对既有的死亡率模型进行改进和扩展,努力提高模型的预测效果十分重要。2死亡率模型理论2.1确定型死亡率模型关于死亡率模型,近年来学术界的成果颇丰。最早的死亡率模型是确定型死亡率模型(确定型死亡率模型),最为经典的确定型死亡率模型是De Moivre提出的生存曲线模型,他最早提出了用死亡力来描述和刻画死亡过程,其死亡力公式如下:(1)其中,x表示年龄,W表示极限寿命,且0 x。随后有学者对死亡率模型进行了改进,如Gompertzs模型使用年龄的指数模型来表示死亡力,(x)=Bc,其中B0,cl;随后Makeham对模型进行了改进,在原模型的基础上增加了一个常数项,具体形式为u(x)=A+Bc*,其中B0,A+B0,x0。2.2随机死亡率模型确定型死亡率模型只考虑了年龄和死亡率之间的关系,并没有考虑到死亡率会随时间变化,它是从参数假设的角度出发,通过对死亡率的经验数据进行建模分析来确定参数,一收稿日期:2 0 2 3-0 3-0 1作者简介:张倩(1994-),女,河北保定人,研究生,硕士,主要研究方向:精算与风险管理。2023年第0 5期(总第 2 45 期)文献标识码:A文章编号:2 0 9 6-9 7 59(2 0 2 3)0 5-0 0 6 8-0 3般只能用于调整死亡率的数据,但是无法对未来的死亡率进行预测。基于上述问题,随后有学者提出了动态死亡率模型,也称为随机死亡率模型,即在静态死亡率模型的基础上增加了时间效应,并对模型进行了改进和扩展,不仅考虑到了历史经验数据的影响,还考虑到了各种随机因素的趋势影响。最具有影响力的随机死亡率模型是1992 年Lee和Carter提出的Lee-Carter模型(LC模型),且沿用至今,它在模型中增加了时间效应,适用于全年龄段人口死亡率,其基本形式如下:log(m,)=,+,k,+8x,(2)其中,死亡人数(D(t,x)暴露人数(E(x,t)亡率;:=Z,/m(m.),表示死亡率随 x 变化;:年龄x对死亡率变动的敏感程度;k:时间t对死亡率变动的敏感程度,是随机时间因素,相当于一个带有漂移项的随机游走过程(ARIMA过程);&xl:服从标准正态分布的残差项。有无数组的r、r、k,能够满足Lee-Carter模型的要求,因此,为了获得唯一确定的参数估计值,一般假定,=1,k,=0,然后可以通过多种估计方法对模型参数进行估计,如奇异值分解法、最小二乘法、加权最小二乘法、最大似然法等等。Lee-Carter模型因其简单易懂的结构且良好的拟合效果,被称为最经典的死亡率模型,具有非常大的影响力。之后有众多学者对Lee-Carter模型进行了改进和扩展,例如,Renshaw等提出了RH模型(队列效应模型),即在原有Lee-Carter模型的基础上加入了出生因子,具体形式为log(m,)=,+B0k,+B-x+8x。随后,Currie提出了APC模型(Age-Period-Cohort模1型),他实际上是对RH模型进行了简化,同样包含了出生年效u(x)=-应,具体形式为log(m,)=,+k,+Y-x+8x/。Ca i r n s 等利用logit变换对死亡率进行建模,提出了基于年龄和世代效应的CBD模型,主要适用于描述和预测高年龄人口死亡率预测,具体形式为 logit(q(x,t)=log=k+k(2(x-x)+8x1,其中,1-q(x,t)q(x,t)是年龄为x岁的人在t和t1 年之间死亡的概率此外,随机死亡率模型还有APC模型、Plat模型、M8模型等等,但绝大部分死亡率模型均假定死亡率与多个影响因子之间具有某种线性相关关系,这些因子大致可分为三大类:年龄、时间和出生年效应,即:68表示年龄为x的人在t时刻的中心死q(x,t)Changjiang Information&Communications其中,g()表示一种变换函数,()代表年龄效应,k(代表时间效应,代表出生年效应,i=1,2,3,,l。2.3机器学习在死亡率中的应用动态死亡率模型在一定程度上对历史经验数据进行了很好的拟合,并且得到了相对准确的预测结果。近些年来,随着计算机技术和数据科学的快速发展,一些学者紧跟时代,将随机森林、神经网络等机器学习方法引入到精算领域中,并对死亡率进行建模和预测。例如,国内学者旷开金等通过构建BP神经网络结构模型,对福建省的人口死亡率进行建模和预测,张连增等使用自编码器对死亡率数据进行建模和预测,国外学者Deprez等利用梯度提升回归树算法,对瑞士的死亡率数据进行建模并预测等等。各种机器学习模型的结果均显示,相较于经典的Lee-Carter模型,回归树、随机森林、神经网络、深度学习等机器学习方法均可在一定程度上提高死亡率模型的拟合及预测效果。基于机器学习算法,论文提出设想:将二维卷积神经网络(CNN)应用到死亡率模型中,即输入二维的图片类型死亡率样本数据,可将邻近的死亡率数据对当期死亡率的影响纳入到模型当中,可探索死亡率之间的潜在的非线性结构的关系,在一定程度上有可能会对模型的拟合和预测效果有所提高。3基于二维卷积神经网络的死亡率模型3.1卷积神经网络概述卷积神经网络(Convolutional Neural Networks,CNN)是一种卷积计算且具有深度结构的前馈神经网络(FeedforwardNeuralNetworks),它可以从多个维度提取图像中的特征值并完成最终的分类,在图像识别领域具有广泛的应用。彩色图片是由红绿蓝(RGB)三种颜色叠加而成,因此,与常规的神经网络不同,卷积神经网络的神经元以三维排列,可以将三维的输入变量转换为输出变量。例如,一张12 8*12 8 大小的白色图片可以表示为RGB(2 55,2 55,2 55),在卷积神经网络中就可以用3个12 8*12 8 大小的数据矩阵作为输入数据。而二维卷积神经网络(2 D-CNN)输入的是灰色图片数据,即二维矩阵形式的数据,用于图片的分类运算。在应用死亡率数据进行建模时,可用死亡率的大小表示输入图片的灰度,死亡率越低,输入的图片的颜色就越深。传统的卷积神经网络是一种含有多个隐藏层的深度学习算法,包含输入层、卷积层、池化层、全连接层、输出层,二维的卷积神经网络输入的是二维的样本数据,利用卷积核的固定步幅地移动完成卷积运算生成特征图,再经过池化层的降采样处理对数据进行降维,得到局部的特征图,最后通过全连接层将高维度的局部特征信息整合成全局特征,用于最终结果的输出。卷积层(Convolutional layer)中的每层中包含多个卷积单元,它是通过反向传播来计算算法得到每个卷积单元的各种参数。卷积层处理数据时可以保持数据的形状不变,比如说卷积层以三维的形式接收数据,经过处理后会将三维的数据输入到下一层中,其主要作用就是用来提取图像的局部特征。池化层(Poolinglayer)实际上是一种形式的降采样,可以将卷积得到的高维度特征进行压缩降维处理,得到新的、低维度的特征,也就是可以将一块数据进行抽样或者聚合得到的值来代替该区域的总体特征,同时也可以对过拟合问题进行有效控制。全连接层((Fully-Connected layer)其实就是简单的前馈神经网络,通常为神经网络中的最后几层,在整个卷积神经网络中起到分类器的作用。在网络结构中,卷积层和池化层操作后得到的是高维的局部特征,需要由全连接层进行处理后整合生成全局信息,用于最后对图像进行分类的任务。69张倩:卷积神经网络在死亡率中的应用g(m,)=E,p0 xr2,+s(3)3.2卷积神经网络在死亡率中的应用卷积神经网络进行图像的识别时有三个主要的特点。首先局部连接,在卷积神经网络中,相邻两层的神经元之间只有部分神经元进行了连接,而非其他神经网络中的所有神经元之间的全部连接。由于在神经网络中,神经元之间的连接数与模型中的参数数量成正相关关系,因此与传统的神经网络相比,卷积神经网络中的模型参数大大减少。其次是权值共享,在卷积层中每一个卷积核都可以通过移动生成一张局部特征图,并且对于每一张特征图来说,卷积核中的系数是共享的,这在一定程度上也可以减少参数的数量,避免出现过拟合的情况发生。最后是降采样,在池化层进行降采样操作时,可以使图像的分辨率降低。在利用二维卷积神经网络进行死亡率建模时,定义mx,为x岁的人在t年时的死亡率,我们可以建立以mx为输出结果的二维图像型的数据5m(x,2,s),它包含了年龄在x-xix+x2之间的滞后k年的数据(1ks),并以5m(,x2,s)为自变量,以mx.为因变量进行建模和预测。例如,图1为5m,(3,3,5),包含了年龄在x-3,x+3 之间,时间在t-1,t-5之间的数据(维度为5*7)。每一行表示在不同年份下的同一年龄的人的死亡率,每一列表示在同一年份下不同年龄的人的死亡率,对角线数据表示同一年出生的人随着年龄增长其死亡率的变化。以Sm(3,3,5)为自变量,mx为因变量进行建模,即:(4)agcmx+3.t-5m+3,-4mx+3,t-3mx+3t-2mx+3-1mx+2t-5m+2.t-4mx+2.t-3mx+2.t-2mx+2.t-1mx+1t-sm+1t-4mx+1t-3mx+1t-2ma1t-1mx.t-smx.t-mx.t-3m-1mx-1.t-5mx-1.-4m-1t-3me-1t-2mx-1t-1mx-2.t-52m-2.t-m.-2.t-3mx-2.-2mx-2.-1mx-3,-5mx-3,t-4mx-3,t-3mx-3,t-2mx-3,t-1period图1由此可见,死亡率mx.t不仅与的年龄x、时间t和出生年t-x有关,还与其相邻的年龄、时间和出生年有关,而且还将相邻的死亡率数据的影响纳入模型当中。同时,将原有的死亡率数据重新组合构建成新模型数据结构,扩大了样本容量,在一定程度上可以提高模型的拟合效果。观察5m(3,3,5)的数据结构可发现,作为自变量的数据包含了直到t-1年时的数据,也就说,新模型在训练集和测试集上进行模型拟合和预测t年的死亡

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开