分享
公共政策评估中的随机控制实验:实施困境与突破策略.pdf
下载文档

ID:3632513

大小:1.03MB

页数:9页

格式:PDF

时间:2024-06-26

收藏 分享赚钱
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
公共政策 评估 中的 随机 控制 实验 实施 困境 突破 策略
云南行政学院学报2024 年第 2 期24政治理论公共政策评估中的随机控制实验:实施困境与突破策略*杨代福,穆冬梅摘要:采用随机控制实验方法来进行政策评估,已成为公共政策或项目评估的“黄金标准”。但是,随机控制实验方法在中国政策评估过程中还运用较少,评估者缺乏对其实施困境与突破策略的深入认识。本研究在深入分析随机控制实验方法及其适用范围的基础上,对随机控制实验的实施困境与突破策略进行了系统的考察与总结。研究发现,采用随机控制实验开展政策评估主要面临着实验方法本身的复杂性、实验方法引发的公共价值分歧以及随机控制实验融入中国政策场域的挑战三个层面的困境。关键词:公共政策;随机影响评估;政策评估;项目评估;随机控制实验中图分类号:D082文献标识码:A文章编号:1671-0681(2024)02-024-009作者简介:杨代福,重庆大学公共管理学院教授、博士生导师、博士,研究方向:公共政策分析与循证治理;穆冬梅,重庆大学公共管理学院博士研究生,研究方向为公共政策分析。一、引言公共政策评估是公共政策制定和执行过程中的重要环节。党的十八大以来,公共政策评估逐渐受到各级政府的高度重视。2015 年关于加强中国特色新型智库建设的意见中明确提出,要建立健全政策评估制度,党的十九届五中全会审议通过的关于制定国民经济和社会发展第十四个五年规划和二三五年远景目标的建议 再次强调,要健全重大政策事前评估和事后评价制度。可见,强化政策评估,发挥评估反馈对政策研究与政策制定的作用,将成为推动我国重大政策、改革落地,促进党和政府科学决策、民主决策的重要内容。科学的评估方法对于政策评估的开展具有重要价值。近年来,相较于双重差分、断点回归、倾向得分匹配等“准实验”评估方法,随机控制实验方法逐渐受到推崇,该方法具有使政策干预在实验组与控制组之间随机分配的优势b。但是,相较于西方的研究,中国学者采用随机控制实验方法开展政策评估目前还处于起步阶段。有研究指出,我国公共政策评估中大部分随机控制实验研究仅是对潜在的、可能执行的政策干预进行探索,研究领域集中在农业、健康、教育等民生收稿日期:2023-07-18*基金项目:国家社科后期资助项目“西方政策评估理论与方法研究”(20FGLB043);重庆市教委人文社科重点基地项目“基于混合方法的双减政策评估与作用机制研究”(22SKJD003);重庆市社科规划项目“基于COVID-19 全球大流行的公共危机循证政策制定研究”(2020YBGL94)。b 张林秀.随机干预试验影响评估的前沿方法J.地理科学进展,2013(6):843-851.25杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略领域,地域上则主要集中在我国欠发达地区与农村a。同时,针对许多政策/项目的随机影响评估大多停留在干预期,不少研究是基于基线调查的结果,真正完整的随机影响评估研究报告屈指可数b。综观随机控制实验在中国政策评估中应用不足情况,其主要原因在于国内学者缺乏对随机控制实验方法的认识以及随机影响评估操作面临的障碍和应对策略的关注。因此,深刻地认识随机控制实验,系统地厘清采用随机控制实验方法开展政策评估面临的困境和应对策略,对于实践随机影响评估,特别是推进其在中国的进一步开展具有重要意义。从国内有关采用随机控制实验开展政策评估的研究看,学者们主要关注随机控制实验的理论、方法及其在公共管理领域的应用,而对采用随机控制实验方法开展政策评估所面临的困境和突破策略关注较少。其中,曹堂哲介绍了随机对照方法的基本理论、具体的实验设计和操作步骤c,张少华和杨少瑞、李帆、马亮等对随机对照实验方法的最新国际进展进行了梳理d,张书维、李纾、李小倩等对国内公共管理实验研究开展的规律和特点进行了分析与归纳e。少数研究针对随机控制实验在中国政策评估中会遭遇哪些困境进行了分析。从宏观层面看,中国采用随机控制实验方法进行政策评估主要面临政府支持力度薄弱,研究者与政府、非政府组织的合作不紧密,时间跨度较长等问题f。从微观层面看,采用随机控制实验在中国开展政策评估主要面临干预设计如何合理与精准,数据分析如何更深入,内部有效性如何克服,外部有效性如何提高等困境g。尽管现有的研究基于中国政策评估实践,从宏观和微观层面指出了采用随机控制实验开展政策评估面临的诸多困境,但这些结论过于零散,缺少系统的分析。鉴于此,本文试图结合随机影响评估理论,基于已有研究和评估实践,全面系统地分析采用随机对照实验开展政策评估面临的困境与突破策略,在此基础上讨论对中国推进随机影响评估的启示。二、随机控制实验方法及其运用要求随机控制实验方法最早出现在医疗领域,该方法起初被用于识别医疗卫生服务中的某种疗法或药物的效果。近年来,随机控制实验在农业经济、教育等社会科学领域得到越来越多的应用,如农业推广服务、公共健康和教育项目等。随着贫困行动实验室(J-PAL)对随机控制实验的探索和诺贝尔经济学奖对随机控制实验成果的肯定,随机控制实验方法逐渐受到推崇。与“准实验”设计相比,由于随机控制实验方法最核心的优势在于具有实验设计的随机性,a 陈叶烽,刘莹,杨雯渊.公共政策评估与随机控制实验基于“规模化”视角的经验启示与中国实践J.管理世界,2023(3):172-196.b 史耀疆等.教育精准扶贫中随机干预实验的中国实践与经验 J.华中师范大学学报(教育科学版),2020(8):1-66.c 马亮.公共管理实验研究何以可能:一项方法学回顾J.甘肃行政学院学报,2015(4):13-23.d 李帆,马亮,李绍平.公共政策评估的循证进路实验设计与因果推论J.国家行政学院学报,2018(5):132-138.e 张书维,李纾.行为公共管理学探新:内容、方法与趋势J.公共行政评论,2018(1):7-36.f 陈叶烽,刘莹,杨雯渊.公共政策评估与随机控制实验基于“规模化”视角的经验启示与中国实践J.管理世界,2023(3):172-196.g 史耀疆等.教育精准扶贫中随机干预实验的中国实践与经验J.华中师范大学学报(教育科学版),2020(8):1-66.26杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略能够规避“选择误差”。因此,其被认为是政策/项目影响评估的“黄金准则”。尽管都遵循“反事实”的实验逻辑,“准实验”方法在评估政策影响的过程中,将未接受政策干预的控制组视为接受政策干预实验组的“反事实”,在实施过程中还会经过一系列的检验来确保实验组和控制组的一致性。但依然存在由不可观测变量造成的“选择偏误”的问题,这是影响评估结果的准确性最关键的因素。相比之下,随机控制实验实现了政策干预在实验组与控制组之间的随机分配,例如评估在家工作对生产力和工作生活平衡的影响时,如果采用在家工作与不在家工作的人进行比较,就可能会出现选择误差,因为比较的往往不是同一类型的人。如果在家工作是自愿的而非随机分配的,那么主动在家工作的人的工作效率和生活工作平衡能力可能高于不在家工作的人,无论他们在家工作与否,其获得工作效率的可能性都会高于不愿意在家工作的人。这样不对称的对比结果就不能反映在家工作的真实效果。只有将在家工作的机会随机分配给一组人,再将其与随机分配且特性相似的另一组没有在家工作的人比较,得到的比较结果才能够反映真实的在家工作的影响效果。因此,相对于“准实验”评估方法,随机分配使得干预组和控制组在干预前没有系统差异。这能够将两个组在政策/项目实施之后的差异归因于干预,而不是其他不可观测因素,从而能够准确捕捉政策/项目“净”影响效应。尽管随机控制实验方法在政策评估中具有明显优势,但并不是所有政策/项目的影响评估都适合采用随机控制实验来实现。首先,如果政策/项目涉及政治、民族、伦理道德等方面的问题,这些项目往往不适合采用随机控制实验来进行评估。因为随机控制实验要对一部分人实施政策干预,这会引发更大的政治、民族和伦理问题。另外,随机控制实验的实施也会面临中途破产的风险。其次,随机控制实验不善于评估宏观经济政策,不善于捕捉一般均衡效应。实验方法的比较优势在于它可以回答关于因果影响的具体问题。为了更好地回答这些问题,我们需要许多单元来随机化。但是,如果我们要评估的政策只能在国家一级出台,而且如果该政策的实施对全国所有人都是立即的,那么几乎不可能进行随机评估。因为这种政策效应是在整个国家层面上发生的,没有控制组。三、政策评估中随机控制实验的实施困境与突破策略作为一种成熟的研究方法,随机控制实验在广泛应用中形成了一套科学的研究体系。尽管如此,由于随机控制实验方法本身的复杂性、实验方法引发的公共价值分歧以及随机控制实验融入中国政策场域的挑战等原因,政策评估中的随机控制实验的实施存在诸多困境。(一)随机控制实验实施的复杂性随机控制实验方法是研究者借助实践中的人为干预,将偶然的、次要的因素分离,从而推断出确定的因果作用路径的研究方法a。因此,一方面,随机控制实验的实施需要进行人为干预,通过设置区别于自然状态下的环境和条件,捕捉实验对象基于实验干预所呈现的一些特征,从而识别干预与结果之间的净效应,推断出确定的规律和结论。另一方面,随机控制实验是包含了实验对象的随机分配、前测、引入干预、后测等一系列的操作性环节的因果作用路径。通过随机分配建立“同质”的实验组和控制组,并对两组对象实施“前测”;实施政策/项目干预;进行“后a 刘军强,胡国鹏,李振.试点与实验:社会实验法及其对试点机制的启示J.政治学研究,2018(4):103-116、128.27杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略测”。最后,通过比较实验组和控制组前后测的差异,得出实验结果。因此,相较于其他研究方法,随机控制实验的实施相对复杂。随机控制实验的复杂性为其顺利实施带来了诸多困境。一是随机控制实验需要精准的干预设计和合理的实验设计。随机控制实验不像其他研究方法一样,研究者多以旁观者的身份进行监测。它要求研究者不仅要观测,还要设计项目、参与到项目实施过程中,捕捉人为设计的干预效果。二是随机控制实验对于项目过程的控制要求也更高。随机控制实验内部效度容易受到诸多外界因素的影响,如遵从、损耗、溢出效应等,评估者需要对实验过程进行严密控制,以降低外部因素导致的实验内部效度不高的问题。三是随机控制实验的实施往往涉及资源的整合与人员的分配问题,需要关注实验过程中的关系处理。1.干预设计精准,实验设计合理。(1)明确项目/政策从投入到结果的因果链。精准的干预设计关系到随机控制实验的成败,评估者需要特别予以重视。随机控制实验的实施逻辑遵循将政策干预随机地给予政策目标群体,然后通过一定的程序观察政策干预带来的净效应。因此,干预设计中最重要的一环是明确项目/政策从投入到结果的因果链,即评估者需要搞清楚政策干预与政策结果之间的影响机制。例如,在针对初中生的事先资助承诺干预对贫困学生高中入学率的影响评估中,评估遵循“事先资助承诺提高贫困学生高中入学率”的影响机制,但是研究结果表明,在中国农村,事先资助承诺既不能改善学生的学习成绩,也没有显著提高他们的升学率。可见,这一因果链条的识别并没有呈现预期的设想,这对随机影响评估的正确进行是一个比较大的威胁。一个好的干预设计,不仅能够帮助评估者厘清政策/项目与潜在结果的因果关系,而且能够帮助评估者准确评估项目的影响效果。因此,在项目设计时,评估者需要基于相关的理论,理清项目的因果链,明确政策干预与结果之间的影响机制。具体操作中需要搞清楚每项干预的投入、活动、产出、短期结果、长期结果分别是什么,干预与结果之间是如何发生作用的。(2)关注随机单位的确定与随机化的实施。如上,随机化是随机控制实验方法区别于其他研究方法的关键,随机化的过程是随机控制实验中最重要的部分。如何确定随机单位是随机化过程中要优先考虑的问题。这关系到随机化能否顺利开展,对后续项目的实施和干预结果的呈现也会产生影响。那么如何确定随机单位呢?评估者确定随机单位需要综合考虑实验对象本身以及政策干预过程中的损耗、部分依从、溢出效应以及统计效力、可行性等问题a。随机单位主要包括在个体和在群体两种类型。随机控制实验应尽可能在个体层面进行随机化,考虑到随机评估过程中的溢出效应、部分依从等问题,评估者还需要根据现实的情况变化及时调整或者改变随机单位。另外,随机化的实施过程中,随机化机会的把握和随机化方法的选择也是需要评估者重点关注的问题,随机化机会的把握对于我们捕捉项目效果具有重要意义。(3)合理的实验组与控制组设计。实验组与控制组设计也是实验过程中重要的一环,好的实验组与控制组设计对于评估者捕捉实验结果具有重要意义。合理的实验组与控制组设计需主要考虑实验设计类型和实验组与控制组的样本量的分配比重问题。那么,评估者选择何种实验设计类型呢?随机影响评估实验设计主要有前测、后测控制组设计、后测控制组设计、所罗门三组设计、所罗门四组设计四种主要的实验设计类型。评估者选择何种实验设计类型不仅取决于该种实验类型本身的特征,还需要根据实验目标、结果变量的个数和内容,同时综合考虑项目进展的情况,数据的类型、充足性、可得性等因素来确定评估中需要使用的实验a Rachel Glennerster and Kudzai Takavarasha.Running Randomized Evaluationsa practical guideM.Princeton University Press,2013:112.28杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略设计类型。例如,米勒等在青海和宁夏进行的贫困学生贫血防治干预实验,评估者欲探究什么样的干预政策能够降低学生贫血。实验过程中评估者设置了三个实验组,单独针对校长的知识干预、学生的补贴、学生的现金奖励和校长的现金奖励。2.政策/项目执行的过程控制须严密。随机实验中的过程控制主要用来增强评估的内部效度,过程控制主要针对部分依从问题和损耗问题两大实施困境。实验中的被试对象是能动的个体,尽管被试对象被随机分配到实验组或控制组,但会出现未完全遵守分配的情况。其主要表现在实验组的个体没有得到实验干预、完成干预,或者拒绝被干预,控制组的个体受到了干预,项目执行人员离开分配或干预程序等几种情况。部分依从缩小了实验组和控制组之间实际干预率的差距,对随机影响评估的内部有效性形成威胁,影响到项目净效果的估计。评估者应如何限制部分依从呢?一是评估者应在方案设计阶段对部分依从问题有充分考量和规避设计,如评估者在方案设计阶段要努力使项目更容易被人们接受,并鼓励更多人参与该项目。二是通过对项目执行人员的管理来降低部分依从问题。如向执行人员展示项目的成功对他们或最终对他们服务的人有真正的价值,树立其项目信心,并采取措施降低其工作负担。三是评估者可以通过调整随机化水平来解决部分依从问题。例如,可以在村庄层面而不是在个体层面进行随机化,通过调整随机化的水平,确保项目人员不会混淆实验组和控制组。损耗的发生是由于随机影响评估往往持续很长时间,导致人们退出了评估;或者由于涉及个体隐私和一些其他问题,实验对象拒绝参与或者拒绝回答一些问题,或者在最终的调查中调查员找不到实验对象,导致数据的缺失,形成损耗。损耗不仅会降低实验组和控制组的可比性,还可能导致一个有效的项目在统计学上没有显著差异。那么如何解决损耗的问题呢?一是在干预设计中要考虑到将来损耗的发生,并且努力设计被试者持续参与项目的机制,保证项目在任何时间都可以进行。二是通过改变随机化水平来减少损耗。例如,研究人员在社区一级的随机分配能保证住在一起的人受到的待遇是一样的,这有助于减少损耗。三是改进数据收集方案。例如通过改善数据搜集工具、合理化数据搜集程序和规范搜集管理来保证数据搜集的效率,继而来降低损耗;通过持续不断地跟踪参与者来减少损耗;通过缩短调查间隔或者给予激励,来降低流失率等。另外,大多数损耗是由于人们的移动或发现调查太长和繁重而无法完成造成的。因此,在进行社会实验时想要跟踪足够多的人员、在足够长的时间内检测与政策相关的影响,关键在于从一开始就要确保样本足够大。溢出效应是指控制实验的干预措施对干预对象的相邻单元产生的影响。当干预措施影响的相邻单元不是实验对象而是更大范围的人群时,就会产生外部有效性问题。具体到中国政策场域,就会涉及相互依存的社会关系、便捷高效的通信条件、错综复杂的社会网络。基于社会状况改善对某一群体实施的政策干预,很难完全隔绝其溢出影响。评估者应当如何应对溢出效应呢?一是准确识别潜在的溢出效应。例如,在方案设计阶段评估者需要搞清楚可能溢出什么、谁溢出、如何溢出、溢出流向谁,溢出效应如何发挥作用,通过什么途径发挥作用,可能产生什么影响等问题。二是通过调整随机化水平,使同一组的人之间发生最相关的相互作用。三是用统计的方法处理溢出问题,溢出不明显,对影响评估不构成威胁的情况下也可以不做处理。3.实验过程中资源与关系的权衡。与合作伙伴共同参与,是采用随机控制实验方法开展政策评估非常鲜明的特征。评估者由于自身没有能力实施实验刺激,评估的过程控制和数据搜集都需要大量的人员参与,因此,评估的顺利实施离不开与项目执行机构或者第三方支持机构的密切合作。在实验过程中,协调评估可使用的各项权限与资源、明确评估中各部门的分工、协调各参与主体的关29杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略系也是必要的。例如,在评估“营养包补充”项目的影响过程中,评估团队首先考虑了国家儿童早期发展战略,依据联合国、中国政府的政策和文件资料,协调各级政府和家庭进行“营养包”的发放;其次,为保证项目的推进,评估团队通过培训的养育师每周进行一次入户家访;最后,为使干预措施能覆盖更多的农村儿童,评估团队还联合陕西省宁陕县政府和公益机构建立了专门的服务机构。(二)随机控制实验方法引发的公共价值分歧公共政策的本质是对社会利益进行权威性分配,效率与公平是公共政策核心的价值追求。提供政策制定、实施过程中的效率,保证政策公正、公平地惠及所需要的政策群体,才能有效化解社会利益冲突,解决社会问题。尽管采用随机控制实验开展政策评估能够科学地识别政策/项目的推进效应,对于公共政策的制定与执行具有重要价值,但采用随机控制实验开展政策评估也面临效率与公平的价值平衡难题。一方面,随机控制实验的实施往往面临时间、金钱、人力资本等耗费较大的问题,另外,由于社会环境的不确定性和实验过程的复杂性,随机影响评估的影响几乎总是小于结果a。因而,在公共政策的效率价值前提下,采用随机控制实验方法开展政策评估的收益与成本关系问题是一个值得关注的问题。另一方面,随机控制实验人为地设定干预策略,将政策/项目分配给不同的政策群体,研究本身会影响到谁得到什么样的服务。因而,随机控制实验的开展与公共政策的公平公正分配之间存在两难问题,这种难题也会引发实验实施的困境。1.随机控制实验的资源消耗与政策效率冲突。实践中,当评估所涉及项目的规模较大时,随机控制实验的开展往往会涉及较多的人群,产生较大的资源消耗。这些资源消耗主要包括时间、经济资源和人力资源耗费等三个方面。有些政策/项目的影响具有比较强的滞后性,短时间内难以捕捉项目效果,这就需要评估者持续地跟进。评估持续越久,评估的成本、团队成员的精神压力等也会随之增加。另外,由于数据采集、实验控制、实验对象的物质激励等因素的作用,随机影响评估往往金钱成本比较高;由于操作步骤多、操作程序复杂、数据搜集难度大等问题,随机影响评估往往需要许多研究者共同为之努力,因而随机影响评估对评估团队的规模也提出了相应的要求。因此,随机控制实验评估项目尤其是大型的随机控制实验评估项目往往耗费巨大。例如著名的墨西哥 PROGRESA 项目,该项目 1999 年的项目预算达到 7.8 亿美元,占墨西哥国内生产总值的 0.2%b。追求服务的高效率和高效益是公共管理者的目的,同时也是检验公共价值的标准。评估者需要权衡采用随机控制实验开展政策评估的资源消耗与收益之间的关系,在项目的设计过程中尽量简单精练,在项目的执行和控制阶段提高工作实施和运营的效率。要努力提升随机影响评估的效率,减少其与公共政策效率追求之间的冲突。2.随机控制实验伦理与政策公平的冲突。由于所有的随机分配研究都会涉及哪些群体和个人得到了政策/项目干预(什么样的服务)的好处,哪些群体被排除在了政策干预利益的分享之外的问题,因此开展随机控制评估不可避免地会面临伦理和法律问题。随机控制实验的伦理问题本质上是公共政策的公平性问题,公共政策执行必然要求其惠及所有目标群体,而不应该因评估需要对目标受众区别对待。评估团队对实验伦理的忽视可能会导致某项政策/项目被视作没能体现a Gueron&Judith.The politics ofrandom assignment:implementing studies and impacting policyJ.Journal of Childrens Services,2008(1):14-26.b 石蓉,史耀疆等.随机干预实验在全球推动扶贫政策改善的经验 J.华东师范大学学报(教育科学版),2020(8):110-125.30杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略政策公平而被取消,导致政策评估无从进行。那么随机控制实验如何规避伦理问题呢?一是确保评估只在项目申请人(或潜在申请人)多于可用名额的地点进行;二是告知人们有关政策/项目干预的信息,给予人们同等的参与/拒绝机会,制定控制的申诉程序,尽量规避拒绝人们获得其有权获得服务的项目;三是设计适当的项目执行程序,以告知项目参与者并对数据充分保密。总之,评估者需要特别警惕受众因政策/项目的实施产生自身不被公平对待的情绪。(三)随机控制实验面临中国政策场域的挑战上述研究指出了随机控制实验的内部有效性面临的诸多困境,这些困境需要在随机控制实验设计、执行和分析过程中进行控制和应对。尽管如此,随机控制实验的结果想要在更大范围的人群里进行规模化复制仍然会面临诸多困境。通常情况下,一个小规模实验项目的结果,并不一定能很好地预测大规模实施类似项目的成本和影响,小型随机控制实验结果,往往无法被大规模的项目复制。与此同时,为推进政策进程,长期以来我国形成了中国特色的“政策试点”机制。理论上,政策试点遵循实验逻辑a,为开展随机影响评估提供了绝佳的环境。但是,与随机控制实验的因果推断逻辑不同的是,中国政策试点的基础是中国治理体制的政治经济逻辑b,二者之间存在一定的张力。1.随机控制实验结果的可复制性困境。政策评估中,随机控制实验的规模化意味着要进行大规模的项目或政策实施,涉及更广泛的群体。随机控制实验的结果复制到更广泛的社会情景中去,会面临情景相依性和政策执行偏差两大困境。随机控制实验的情景相依性是指政策/项目通常会在几个精心挑选的地点和特定的人群中进行,因此其结果可能取决于特定的实验干预地点或实施组织的一些可观察或不可观察的特征。随机控制实验的情景相依性导致其实验结果通常不能扩展到不同的地区或组织。中国社会人口规模庞大,各地区在资源禀赋、经济发展、公共服务等方面差异明显。若将随机控制实验结果扩展到更广泛的政策领域中,实验情境必然发生改变,干预实施和适用的社会经济背景、所依赖的基础设施都变得多样而复杂,诸多这些不可控情境因素都可能会影响到规模扩大后的效果,进而威胁到评估结果在其他情境环境或地区下的普遍适用性(迪顿,2010)。因而,随机控制实验结果的可复制性首先要面临情景相依性的困境。如何解决情景相依性问题呢,学界给出了两种可供借鉴的方法。一是尽可能多地在不同地区或不同组织实施重复实验并对其进行系统综述。通过重复实验,帮助评估人员理解干预过程中究竟是哪些关键情景因素对直接干预效果产生了作用。二是设计并实施机制实验,对政策干预的核心机制进行检验。实验设计不可能穷尽所有的实验情景,机制实验通过强调对实验过程中的核心机制的检验,提醒评估者把握政策干预与结果之间的关键作用逻辑。在中国复杂且差异大的社会政治经济环境下,评估者将随机控制实验用于公共政策评估时,需要考虑政策评估所面临的情境依赖性问题。另外,将随机控制实验规模化将不可避免地面临一个大规模的项目执行和管理困境。评估者需要保证政策/项目认真地进行并得到有效的监督,以减少项目执行偏差。2.随机控制实验与政策试点之间的张力。政策试点是中国政策制定的一种特殊制度安排,其实质是将实验这一研究方式应用于公共决策或社会实践领域c。但是,中国场域中政策试点的实施逻辑又导致了其与实验因果逻辑之间的张力。这种张力主要体现在两个方面:一是对试点地区a 赵慧.政策试点的试验机制:情境与策略J.中国行政管理,2019(1):73-79.b 王思琦.中国政策试点中的随机实验:一种方法论的探讨J.公共行政评论,2022(1):30-50、197.c 赵慧.政策试点的试验机制:情境与策略J.中国行政管理,2019(1):73-79.31杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略额外的资源投入减弱了随机影响评估的内部效度。中国的政策试点是政策过程的一个特殊环节,是为了验证试点规划政府(中央政府或上级政府)预设政策方案的正确性而开展的自上而下的“试对”活动。为了使试点取得成功,规划政府不仅将政策/项目本身投放到试点地区,还将相关资源集中投入到试点地区。但是,从随机控制实验因果推断的逻辑来看,给予试点地区额外的资源或权力,相当于引入了混杂因素,这将影响随机控制实验效果归因,将对其内部效度构成威胁。二是试点地区的选择方式增加了随机控制实验的样本选择偏误。中国政策试点过程中试点地区的选择是规划政府与地方政府互动的结果。一方面,规划政府为了“试对”的成功,往往倾向选择拥有较多资源、具有较好经验积累、成功可能性较大的地区a。另一方面,地方政府在晋升激励的动机下,为争取资源,也具有主动积极争取政策试点的偏好。从这种意义上来看,当前政策试点单位的选择并非随机,试点地区与其他地区的对比也不具有随机控制实验中的对照意义,试点地区的选择方式增加了随机控制实验的样本选择偏误。如何在中国政策试点的背景下实施随机控制实验呢?第一,将随机控制实验的思想融入政策试点,避免混杂因素对实验效度的影响。随机控制实验的内部效度问题是其科学性的基础,试点单位在接受政策干预的同时,也接受了诸多相关资源的投入,随机控制实验的内部效度受到诸多的混杂因素的影响。未来,从因果推断的逻辑来看,政策试点应更多地融入随机控制的思维,应尽量避免对试点单位进行除政策干预之外的其他资源的投入,以避免混杂因素对实验效度的影响。第二,提高政策试点对象选择的代表性。随机控制实验的核心在于随机化。随机化可保证试点地区与非试点地区在接受“政策试点”之前不存在系统性差异,进而能够将政策效果归因为“政策试点”的影响。当前我国面临经济社会各方面发展不平衡不充分问题,城乡之间、东中西部之间发展不平衡问题日益突出。对此,未来“政策试点”对象应在全局上具备代表性,从而克服选择偏差,提高试点评估的科学性。四、结论与讨论随机控制实验是因果推断的黄金准则,采用随机控制实验方法开展政策评估,对于促进政策过程的科学性具有重要价值。但是,由于随机控制实验存在诸多实施困境,当前中国场域中采用随机控制实验开展政策评估还比较少见。本文在讨论了随机控制实验的特征和适用的基础上,基于随机影响评估的理论,结合相关随机影响评估实践,系统分析了采用随机控制实验开展政策评估的实施困境和突破策略。研究发现,由于随机控制实验方法本身的复杂性、实验方法引发的公共价值分歧,以及随机控制实验面临的中国政策场域挑战等原因,政策评估中的随机控制实验的实施存在诸多困境。本研究对于深入理解随机控制实验及其实践困境提供了理论支撑,为政策评估者在实践中更好地操作与执行随机控制实验,推动随机控制实验在中国政策场域中的实施提供了理论与经验借鉴。采用随机控制实验开展政策评估是一项复杂的活动,评估者需要精准的干预和合理的实验设计,需要对项目过程的进行严密的控制。同时为保证随机控制实验的顺利实施,还需要巧妙地处理实验过程中的关系。这对中国政策评估参与主体的研究能力和专业技术提出了更高的要求。当前,以社科院、高校等为代表的第三方评估主体的力量比较薄弱,中国的政策评估依然是政府主导,a 冯栋,何建佳.政策试验的要件构成及其优化对策J.行政论坛,2008(1):59-61.32杨代福,穆冬梅:公共政策评估中的随机控制实验:实施困境与突破策略这在一定程度上影响了随机影响评估的实施与推进。未来,中国的随机影响评估需要探索更多的政府与评估组织合作模式。如有学者提出研究者与政府合作的观察模式、部分参与模式、全程参与模式,这些模式主张政府以观察者、实验设计者或者实验的完全实施者的身份参与随机影响评估。通过深度的合作与参与实验,将政策/项目转化为政府的行动,以推动随机影响评估的进程。随机控制实验,尤其是涉及大型项目的随机控制实验,需要耗费大量的人力、物力和财力,因而,随机影响评估离不开政府或者其他社会组织的资助。当前,中国的随机影响评估尚处于起步阶段。为推进随机影响评估的更好开展,中国政府应在资金、技术、政策等层面予以支持,并积极帮助评估者寻求国内外社会机构的资助。同时,由于随机影响评估耗费巨大、政策干预还会引发伦理问题,因此,中国政策评估者应更加谨慎,需要更多地权衡实验的收益和成本问题。我国经济社会高速发展,诸多的政策和项目落地亟需实践经验与理论支撑,要想将一项政策推广到其他地区,政策成本和异质性影响都是首要考虑的问题,而这些问题都可以通过随机控制实验来解答。尽管某一政策干预可以为其他地区的政策研究和制定提供借鉴和参考,但地区间经济社会发展存在诸多差异,并不意味着地区之间的经验可以完全照搬。因此,政策的制定应该立足于本地问题与情境,在已有理论猜想和机制假设的基础上使用随机控制实验进行政策干预效果评估。另外,中国的政策试点为随机控制实验的开展提供了诸多便利条件,但是,政策试点与随机控制实验存在张力。未来,中国应在政策试点的背景下,探索更加合理的方式和方法,促进试点过程中随机控制实验思想的融入,从而推进公共政策评估的科学化。主要参考文献1 史耀疆等.教育精准扶贫中随机干预实验的中国实践与经验 J.华中师范大学学报(教育科学版),2020(8).2 李帆,马亮,李绍平.公共政策评估的循证进路实验设计与因果推论 J.国家行政学院学报,2018(6).3 刘军强,胡国鹏,李振.试点与实验:社会实验法及其对试点机制的启示 J.政治学研究,2018(4).4 赵慧.政策试点的试验机制:情境与策略 J.中国行政管理,2019(1).5 王思琦.中国政策试点中的随机实验:一种方法论的探讨 J.公共行政评论,2022(1).6 张林秀.随机干预试验影响评估的前沿方法 J.地理科学进展,2013(6).Stochastic Control Experiment in Public Policy Evaluation:Implementing Dilemma and Breakthrough StrategyYang Daifu,Mu ZhaomeiAbstract:The Implementation of Randomized Evaluation has become the“gold standard”or“flagship”of public policy or project evaluation.However,due to the lack of understanding of its implementation obstacles and coping strategies by researchers,it is seldom used in actual policy or project evaluation.In this paper,the contents of 100 random impact assessment reports in J-PAL database are systematically investigated,and the coding analysis is carried out around the dilemmas and breakthroughs of the Implementation of Randomized Evaluation in the actual reports.The results show that there are 20 kinds of obstacles in the operation of stochastic impact evaluation,and each obstacle has a certain coping strategy.This study is helpful for evaluators to flexibly use randomized controlled trials to carry out policy evaluation in practice and promote the development of randomized impact evaluation in China.Keywords:random impact evaluation;policy evaluation;project evaluation;randomized controlled trial(责任编辑:陈文兴)

此文档下载收益归作者所有

下载文档
你可能关注的文档
收起
展开