分享
基于工具变量的变系数测量误差模型的分位数回归估计_杨宜平.pdf
下载文档

ID:2373191

大小:2.20MB

页数:15页

格式:PDF

时间:2023-05-10

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
基于 工具 变量 系数 测量误差 模型 位数 回归 估计 杨宜平
系统科学与数学()(,),基于工具变量的变系数测量误差模型的分位数回归估计杨宜平林静怡赵 培 信(重庆工商大学数学与统计学院,重庆 ;经济社 会应用统计重庆重点实验室,重庆 )摘 要文章 考虑协变量含有测量误差的变系数模型,为了消除测量误差的影响,在估计过程中 引入工具变量,利用工具变量对 含有测量误差的协变量进 行校正为了获得稳健估 计,利用分 位 数回归方法 得到不同分 位点上系数函数的估 计在一些正则条件下,证明了所 提出的估 计的渐近正态性模拟研究比较了估计,基于工具变量校正的分 位 数回归估 计()以及 基于工具变量校正的最小二乘 估 计(),模拟结果 表明文章 提出的方法优于已有的方法最后采用文章 提出的方法对中 国农 村居民的金融 资 产余额的影响因素进 行了分析,结果 表明住户偾务余额系数呈现型变化,家庭收入系数呈现倒型变化关键词变系数 模型,测量误差,工具变量,分 位数回归()主题分类号,(,;,),国家社科基金(),重庆市自然科学基金(,),重庆 市教委人文社科一殷项目(),重庆市社科规划委托项目()资助课题收稿日期:,收到修改稿日期:通信作者:宜平,:编 委:张新雨系统科学与数学卷 ,(),(),引言在当今社会,即便科 技 技术快 速发展,也会由于设 备不够精良或是使用不当,会使 得测量出来的数据含 有测量误差若直接使用含 有测量误差的数据进行统计分析,这种方法称为方 法,会 对模型的估计结 果造成 不良的影响,例 如有偏的估 计,效率的降低,检验功效的降低 等 等众多学 者对测量误差模型展 开了研究,如范国良等在非参数部分带 有测量误差的变系数部分非线性模型中,利用经验 似然方 法构造了模型中参数和 非参数部分纠偏的经验对 数似然比统计量;曹智苗和王秀丽提出了一种惩罚的偏差校正方法来确 定带 有测量误差的变系数 模型的真实结构;刘智凡等考虑了协变量带 有测量误差时变系数 模型的估 计问题,其通过工具 变量对测量误差进行校正;金蛟 等提出了一种在测量误差服 从拉普拉斯分布时参数的损失修正估计;曹连英和毕琳考虑了变量存在测量误差的情况下,对半 参数 变系数部分线性模型的估计进行了研究,给出了参数的岭估计及非参数部分的估计;李 腾 等考虑自变量存在测量误差且参数 分量附加有随机约束条件时的估计问题时,基于 校正最小二乘估 计和混合估计 方法,提出了参数 分量校正的混合估计上述 文 献中对含 有测量误差模型的估 计多采用最小二乘 估 计,当数 据出现尖峰,厚尾,异常点等情形 时,最小二乘估 计并不稳 健为了得到稳 健的估 计,本文采用分位 数回归方 法,该方 法被广泛使用例 如,等考察 部分线性 变系数测量误差模型,利用工具 变量校正测量误差后 获得模型中兴 趣参数的分位 数回归估计;刘 艳 霞等针 对部分线性变系数 模型的参数估计问题,提出了一种新的复 合分位数回归估计方法,利用复 合分位数回归方法估计参数分量;吕晓玲等考虑了删失分位 数 变系数回归模型的准则,并基于准则给出了兴 趣参数的模型选择和平均估计本文针对变系数测量误差模型,提出了基于工具变量的分位数回归估计在一些正则条件下,给出了系数函数 估计量的渐近性质模拟研究了本 文提出方 法的有限 样本 性质,并 分析了数据本文所提出的方法优势在于:)通过工具变量来校正测量误差对系数函数估计造成的偏差,无需假定特定的误差模型结构 或已知测量误差方差)利用分位数回归方法获取系数函数的估计,不仅可以刻画系数函数不同分位点 的变化,而且弥 补了最小二乘方 法不稳 健的缺点,所得到的估 计更稳 健杨宜平 等:基于工具变量的变系数测量误差模型的分 位 数回归估 计 方 法 与主要结果考虑 如下变系数 模型(),()其中是一维响应 变量,和是协变量,()(),(),()是维回归系数函数,是 模型误差,且满足(,),(,)不失一般性,本 文假定(是一维变量,是带 有测量误差的维协变量由于存在测量误差,的真实值无法观测到假设观测到带 有测量误差的变量戈,并且和戈满足 如下关系():(),()其中是可观测的一维工具 变量,()(),(),()显然()式等价于且丑(进一步假定工具变量与模型误差独立,模型误差和测量误差独立,并且与协变量(相互独立采用工具变量校正测量误差的文 献可参?文献,?假(,兄,是来自总体(;兄,)的一组独立同分布的样本,兄(,元)为了获得()的无偏估计,下面我们给出二阶段估 计过 程首 先,用工变量对协变量进行校正,采用局部线性回归方 法获得足的估 计尤今()令元是元的第个分量,采用局部线性回归方法估计(),其中()是()的第个分量,即最小化)(),()令和是最小化()式的解,那么尤)其中()()是核函数,心是带宽,其次,基于 校正的测量误差,对含 有测量误差并校正后的变系数模型采用局部线性分位数回归方法估计系数函数()及其一阶导数,构建系数函数的局部线性分位数回归估计的目标函数如下;()()()其中()()是分位数损失函数,()(,()是核函数,是带宽,尤是兄的第个分量上述目标函数中包括办个 未知参数,即(,),)令,是目标函数()的解则(),)下面讨论的渐近性质记,办。首先 给出定理所需的一些正则条 件()的密度函数扣在上有 界,其中是的有 界 支 撑扣和对连 续二阶可导,并且在上满足条 件,即存在原点 的邻域,和常数,使 得对于 任何,成)(卜)戍)(州 系统科学与数学卷()随机变量具有 有 界 支 撑,其密度函数()是正的且二阶导数连 续(,)的联合密度函数,(?,)在 支 撑上是连 续的()系数函数(?在上具有 连 续二阶导数()对:,有(),()有 界且远离,具有 连 续一致有 界导数()带宽 和,满足心,是 大于的常数进一步,当一时,一,一且()一()(?是正定矩阵,其中(?的定义见 定理定理如果条 件()()成立,则有()()()()()()(),其中丑()()(),(,),在条 件()中定义,飞(),),)且)(),是办)的二阶导数,?(如)丑(?),(如)丑(,)?定理中包含了额外的偏差项()厂(?,产生该偏差项的主要原因是估计(?)导致注 意到,当时,额外的偏差项收敛到如果可观测到且不含测量误差,那么该偏差项消失,此时的渐近结 果和等中的结 果一致 等研究了部分线性变系数测量误差模型的分位数回归估计,其中参数分量部分含测量误差 等在定理中给出了参数 分量和 非参数 分量估 计的渐近性质由于估计过 程中需利用工具 变量校正测量误差,因此产生了与本 文类 似的额 外偏差项当协变量观测 不存在测量误差时,偏差项消失,此时本文的渐近结 果也与 等定理中系数函数估计的渐近结 果一致数值模拟本 节讨 论所 提出估计的有限 样本性质,考虑 如下 含测量误差的变系数模型()(),十,几,其中()(),(),变量和均来自,上的均匀分布,测量误差?(,),模型误差考虑正态分布,分布和柯西分布三种情形,即(,),(),(,)样本量分别取,和,对以上情况重复运行 次非参数方法的一个重要问题就是关于带宽的选择,在本文为使 得估计结 果更好,在 带宽的选择上结合拇指法则和欠 光滑的需要,为达到数据模拟结果的有效性,带宽心,知,其中心和知分别是和的样本标准差核函数()和()均采用核,即()为了衡量系数函数的估计精度,采用均方根误差(杨宜平 等:基于工具变量的变系数测量误差模型的分 位 数回归估 计 ,)来衡量,其定义为()彳),其中是格子点,本 文模拟研究中首先,比较了最小二乘估计(),刘智凡等提出的基于工具变量校正的最小二乘估计(),分位数回归估计(),以及本文提出的基于工具变量校正的分位数回归估计(),模拟结 果见表表给出了,以及四种方法在不同样本量和不同模型误差 下()和()的均方 根误差,从 表可以看出)相比,给出了较大的)在正态分布 下,与的相差不大,在分布和柯西分布 下,方法给出了较大的,给出了较小的,说明了方法 更稳 健)随 着 样本容 量的增 加,不同误差分布 下,的逐渐减小表不同样 本量和不同模型误差分布情形下系数函数 估 计的均方根误差()(,)()(,)方法)()()()其次比较了和,模拟结 果见图和图和图分别给出了样本量 时,和两种方法在不同误差分布 下的估计曲线和的箱线图从图和图可以看出,方法估计得到的曲线与真实曲线 相差很小,估计得到的曲线与真实曲线有明显偏差,的比的更小,说明本 文提出的估计有效消除了测量误差对 估计的影响 系统科学与数学卷)()(,)图不同误差下基于和方法奶(?)估计曲线以及其的箱线图,(?),)(,)()?(,),)?()?(,)图不同误差下基于和方法(?)估计曲线以及其的箱线图,(?),)杨宜平等:蒸于具变量的变系数测量误差模型的分位数回 估计接着本文给出了样本量时 不同模型误差下,分位点处系数函数的估计结 果,如图所示,从图可以看出在 不同误差分布下系数函数 在各分位点的拟合效果 不错图不网模型误兹下基于方法()和():萑不同分位点的估计曲线,(?)(?),)最后比较了不同误差分布 下和的拟合效果,结果如图和所示从图和可知,当模型误差 服从正态分布 时,屯(?和?的拟合差 别 不大,但当模 型误差服从()分布和)分布时,方法拟合效果更差卜()心(,)系统科学与数学卷丨?叫。,。?)()卜(,)图在 不同误差下基于和方法奶(?)的估计曲线及其箱线图,(?),)卜()()(,)(,)图在 不同误差下基于和方法(?)的估计曲线及其箱线图,(?),)实例分析本节将 采本文提出的方法分析数据,该数据以农 村住户为研究 对象,考 察家庭收入和住户债余额对金融资产余额的影响,对数据进行预处理后抽取了个家庭住户,构建如下含 测量误差 的变系数 模型(),!,杨宜平等:蒸于具变量的变系数测量误差模型的分位数回 估计其中(切,名表示第个家庭的金融 资产余 额,表示年 龄,表示第个家庭(年住户债务余额,表示真实的不可观测的第个家庭年可支配收入在实证分析中,家庭收入由于各种原因存在测量误差(参见武鋪和徐永辰丨),因此无表示观测 到的第个家庭 年可支 配收入,含测量 误差为了校正测量 误差,本文采用滞后一期的家庭可支配收入作为工具变最,即为年家庭可支配收入,采用该 变最是合理的一方面,从年的家庭可支 配收入与年的家庭可支配收入的散点图(见 图)来看,二者高度相关,可以假定两者的关系为戈()十另一方面,年的家庭可支配收入与影响年家庭金融资产余额的其它因素如受教 育 水,性别,年龄等相关性不高关干采解释变量的滞后一期作为工具变量巳有文献常常采数据的描述性统计见表年 家庭可支收入(单 位:万元图午与年家庭可支配收入的散点图()表变量的描述性统计()变量祥本数均值标 准差年龄 家庭支配收入生活消费支出总额金融资产余额 住户债务余额 首先,我们绘制了金融资产余额的直方图与密度图,如图所示从图中可知金融资产余额是非正态的,进一步进行正态检验得到值为 小 于,因此与最小:乘相比,采用分位数回归方法分析该数据更合理类似模拟研究,我们采用,等种方法分析 该数据首先给出了和的拟合图,如图所示从图中得到和变化 趋势相同,住户债务 余额的 系数呈现口型的变化,家庭收入的系数呈现倒型的变化这表 现出在 不同年龄段,住户债务余额与家庭收入对金融资产的影响不同年轻的人对于消费和 生 活品质的追 求越来越强 烈会导致其 背上一定的个人负偾,老年人呈现过度负偾趋 势这可能 是由于 系统科学与数学卷租金和房产价格的上涨等导致相应的养老金较低,所以在这两 个年龄阶段时负债会増加,同时家庭收入会降低而中年人对于储 蓄的意识更强烈,将大部分资金用于存款,购买股票或基金等因此负债相对 较 低,家庭收入増加其次,图给出了在不同分位点 下的拟 合曲线图从图可以看出,在金融资产余额的不同分位数水?,住 户债务和家庭收入对其影响都是不同的在分位点时,债务余额对金融资产的影响表现出先増后减的趋势,家庭收入表现出正向的影响;在分位点时,债务余额对金融资产的影响表现出先减后

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开