温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
实证
法学
研究
中的
因果
推理
可信度
丹尼尔
实证法学研究中的因果推理可信度*丹尼尔E.何 唐纳德B.鲁宾*著丁文睿*译摘 要 通过对实证法学研究中广泛应用的可信因果推理的发展回顾,得出研究设计胜于方法分析的结论。用更直观(而非技术)的方式对匹配和回归不连续性进行展开,申言之,将其运用于有关监狱设施对犯人行为不端的影响的研究,并对结果数据与实验数据进行比较。认为将现代因果推理方法统一起来的是研究设计创造是一种不参考任何结果数据的、可比较的单位子集。在这些子集中,结果差异会可信地归因于数据处理方式而非对照组实验条件,且传统分析方法在这一过程中的作用微乎其微。法律中的可信因果推理依赖于实质性的法律知识,而不是数学知识。关键词 研究设计 政策评估 匹配 回归不连续性*本文原载于 Annual Review of Law and Social Science,Vol.7(December 2011),pp.1744。*丹尼尔E.何(Daniel E.Ho),斯坦福大学法学院威廉本杰明斯科特(William Benjamin Scott)与露娜M.斯科特(Luna M.Scott)讲席法学教授、政治学教授、斯坦福经济政策研究所高级研究员、斯坦福人本人工智能研究所(Human-Centered Artiflcial Intelligence)副所长,斯坦福大学监管、评估与治理实验室(RegLab)主任,曾任实证法律研究学会主席与法律、经济学与组织杂志(Journal of Law,Economics,and Organization)主编,主要研究方向为实证法学、行政法与监管政策。唐纳德B.鲁宾(Donald B.Rubin),哈佛大学统计系统计学名誉教授,曾任哈佛大学统计系主任、国家经济研究局理论与应用统计学研究员,主要研究方向为实验和观察研究中的因果推理、贝叶斯分析方法及其应用、开发统计模型等。*上海师范大学哲学与法政学院诉讼法学 2020 级硕士研究生,美国马里兰大学行为与社会科学院刑事司法与犯罪学 2020 级硕士研究生。实证法学研究中的因果推理可信度 153一、摩尔停车定律昂德希尔摩尔(Underhill Moore)的停车研究一直以来都被人们所忽视。从1933 到 1937 年,这位著名的耶鲁大学法学教授始终试图量化法律关系中的因果效应:他和研究助理清点了停在纽黑文 15 个地区的 13000 余辆汽车,在交叉路口模拟了一个白色环岛,并派警察给 3400 余辆违章汽车贴了罚款标签。虽然这项研究只涉及“界定汽车何时停车”(即车轮停止转动的时间)的细节,但其目标是崇高的这是与法律有关的“人类行为的一般理论”。摩尔自己也承认这次冒险微妙地游离于前卫和荒谬之间:“他(们)嘲笑我的项目不理解我正在为(那些)试图将科学方法应用于探索社会科学的人们写下这篇文章多年后,一个相似的灵魂会从我粗浅的研究中找到一些解决问题的线索。”尽管法学理论和实证研究在那时联系不够紧密,但量化研究作为一种方法论来说实在不应被形容为荒谬。摩尔的研究就像 20 世纪 20 年代和 30 年代的大部分第一批实证法学研究一样,在对法律的因果关系进行推理中,面临着棘手的方法论挑战,而此时现代实验的基础才刚开始成形。直到 1925 年,费雪(Fisher)才提供随机检验方法(randomization)作为实验的“推理基础”(reasoned basis for inference)。那么,怎样才能推断出停车管制的因果效应呢?正如威廉道格拉斯(William O.Douglas)及其同时代的学者所指:“问题将主要围绕着如何发展更适当的技术来控制错误与产生数据,并从这些数据中推断出不同因素的因果关系而展开。”更笼统地来说第一批实证主义法学家如何对“法律会造成何种影响”展开定量评估?摩尔的方法虽不够现代化,但足具开创性。他推断道,当“实验情境不能随意设定”时,人们可以“利用条款自身的含义”,这一见解至关重要。面对针对街道进行“设限”或“不设限”的简单考察毫无意义这一问题,摩尔的解决方案是利用停车限制的地点任意性和时间随机性。比如:在皇冠街,本月街道左侧不得泊车,See Moore U,Callahan CC.1943.Law and learning theory:a study in legal control.Yale Law J.53:2.See Douglas WO.1950.Underhill Moore.Yale Law J.59:18788.See Schlegel JH.1995.American Legal Realism and Empirical Social Science.Chapel Hill:Univ.N.C.Press.See Fisher RA.1935.The Design of Experiments.Edinburgh:Oliver&Boyd.See Clark W,Douglas WO,Thomas DS.1930.The business failures projecta problem in methodology.Yale Law J.39:101324.See Moore U,Callahan CC.1943.Law and learning theory:a study in legal control.Yale Law J.53:8889 154 特色栏目人工智能与计算法学下月则是右侧不得泊车;在教堂街,15 分钟的停车时间限制只到晚上 7 点前,晚上 7 点后则无时间限制,摩尔为检验停车时间限制的有效性,特于晚上 7 点前后分别进行了数据收集。为评估一天中不同时间的差异是否会影响推断,摩尔还让研究助理跟踪研究对象到目的地,从而对交通流量和司机活动的重合性进行调查。图 1 是摩尔收集的关于纽黑文市教堂街的停车数据,x 轴代表停车的分钟数(按照摩尔的说法,这些统计仓每隔 1 分钟、5 分钟或 10 分钟增加一次)。深绿色的轮廓直方图显示了受 15 分钟停车时间限制时,从下午 5:30 至 6:30 停放汽车的停车时间。浅绿色填充的直方图显示的是没有时间限制时,从晚上 7:00 至 8:00 的停车时间。由图表可见,停车时间存在较大区别无时间限制时,约有 36%的汽车停车时间少于 15 分钟,而有停车时间限制时,该比例约为 57%。尽管仍有大量司机未遵守时间限制,但大体上该限制的存在使得每个车位的平均占用时间少了 40 分钟。40有时间限制无时间限制15分钟限制纽黑文市教堂街停车情况分钟(对数尺度)3020频次100013510153060120240图 1:1936 年,纽黑文市教堂街 35 天停车记录的观察数据。浅绿色直方图表示在没有15分钟停车时间限制(灰色虚线)的情况下,晚上7:00到8:00的停车时间。深绿色的轮廓直方图表示有 15 分钟停车时间限制的情况下,下午 5:306:30 的停车时间。x 轴是对数刻度,统计间隔见摩尔和卡拉汉的报告(30 分钟内每分钟记录一次,30100分钟每隔5分钟记录一次,100450分钟每隔10分钟记录一次)。当然,现在看来摩尔的方法在某些方面有所欠缺。比如,由于晚上 7 点以后的泊车需求可能和 7 点前存在较大差异,所以时间限制仍然会影响晚上 7 点以后的停车行为。差异也许仅是偶然,但在“研究设计”这一关键方面,摩尔的研究仍是具有开创性的。实际上,这可能是第一次在法学研究领域非正式地使用我们现在称 See Moore U,Callahan CC.1943.Law and learning theory:a study in legal control.Yale Law J.53:104106.在现代术语中,这些缺陷指的是关于强制变量、“稳定单位处理值假设”和抽样可变性的结果连续性/平滑性问题。实证法学研究中的因果推理可信度 155之为“回归不连续”的设计用 7 点前后时间的非连续性评估停车管制的因果效应出现在该技术正式被运用的 30 多年前。可能就像 Pyx 实验之于假设检验,摩尔对回归不连续的应用也是法学层面上使用统计学的先驱。本文回顾了因果推理数据分析的现代发展,尤其侧重匹配和回归不连续性两种方式。对这些方法进行统一的,是将研究设计的优先次序确定为创建可比子集,而不参考任何关于结果的数据。现代方法更强调方案设计而不是方法分析,这也许是对摩尔研究方法的另一种证明(甚至是摩尔所谓的“志同道合的灵魂”)。下文主要由以下几部分构成:第二部分对社会科学向可信度(credible)和设计导向型推论(design-oriented inference)的大幅转变进行讨论;第三部分涉及广泛使用的对阐明因果推理的中心问题的潜在后果框架(potential outcomes framework);第四部分详细介绍了首次由 BdL进行的,关于最高安全监禁对服刑人员行为不端之因果影响的数据分析和研究;第五部分使用上述数据,对许多困扰传统回归实践的“模型敏感性”问题进行说明;第六部分详细介绍了笔者所谓的研究设计重点:在不参考结果数据的情况下进行收集、组织、测量和准备数据;第七和第八部分将匹配方法和回归不连续性应用于 BdL 进行的上述监狱数据;第九部分对实验结果进行了比较,这两种方法都比基于朴素回归的方法提供了更接近实验结果的预计;第十部分做出总结。二、实证法律研究中的因果推断因果关系一直是实证法学研究的核心。无过错保险法与机动车事故伤害赔偿的关系如何?被法庭指定律师的被告会比自主聘请律师的被告表现更差吗?自由裁量权如何影响最高法院的决定?所有这些问题都促使罗斯科庞德(Roscoe Pound)、菲利克斯法兰克福(Felix Frankfurter)和詹姆斯兰迪斯(James Landis)等人,在二十世纪二三十年代转向了实证研究。然而,他们的努力遇到了前所未有的挫折。威廉道格拉斯(William O.Douglas)在某破产原因研究项目中说:“我们千 See Stigler SM.1977.Eight centuries of sampling inspection:the trial of the Pyx.J.Am.Stat.Assoc.72:493500.See Berk RA,de Leeuw J.1999.An evaluation of Californias inmate classification system using a generalized regression discontinuity design.J.Am.Stat.Assoc.94:104552.Kritzer HM.2010.The(nearly)forgotten early empirical legal research.In Oxford Handbook of Empirical Legal Research,ed.P Cane,HM Kritzer,pp.875900.Oxford:Oxford Univ.Press.156 特色栏目人工智能与计算法学辛万苦得到的事实似乎压根没用。”无独有偶,认知学科也出现了类似的挫折。其认为传统(基于回归的)因果推理(causal inference)存在局限性,对因果推理概念的进一步明晰导致了对“回归时代”日益严重的怀疑。“如果没有强大的设计计量经济学或统计模型无法让相关性与因果推理之间有什么关系。”对此,道格拉斯也许会说:“我们千辛万苦得到的回归似乎也压根没用。”与此相反,艾雷斯(Ayres)授予“大规模微数据”和“田野调查”以“超运算时代”(super crunching)的桂冠,两位著名经济学家也将其称为“可信度革命”(credibility revolution)。甚至还有学者预测,随着对因果推理的深入理解,社会科学将发生“戏剧性的转变”(dramatic transformation)。各领域对因果推理的共有认知就是尽一切可能地严格遵循实验方法。当然,法学也不例外,实证研究方法刷新了我