23大数据分析中的相关性和因果关系刘东亮闫玥蓉摘要:“大数据分析不追求因果关系而只关注相关性”是一种颇为流行但似是而非的说法。实际上,大数据分析并非完全放弃对因果关系的追求,其所关注的相关性是对因果关系的逼近和靠拢,是在无法确定因果关系时的一种折中,这与法律上的因果关系在大多数情况下属于统计的因果关系(强相关)并行不悖。大数据分析的结果可以在法律程序中适用,但受制于数据质量、建模错误等因素,其可靠性有时比较薄弱,从而导致其适用范围存在限制。大数据在法律程序中的作用主要是预警和佐证,仅在少数情况下才可以直接据以作出法律决定。大数据技术具有两面性,在充分利用大数据带来的便利的同时,也需要在观念上破除“大数据的神话”,特别是对大数据的伪相关性风险进行防范,避免可能的“大数据的悲剧”。关键词:大数据相关性法律上的因果关系伪相关性数字政府中图分类号:D90文献标识码:A文章编号:1004-9428(2023)02-0023-19大数据正在深刻改变社会生活以及我们观察、理解世界的方式。〔1〕利用大数据分析结果改进决策,不仅在商业领域得到应用(如各种各样的算法推荐系统),同时也在重塑法律的运作方式,如在疫情防控中广泛使用的“健康码”“一码通”等,即是政府运用大数据技术进行社会管理的鲜明例证。前不久,在引发社会关注的“獐子岛扇贝逃跑案”中,有关部门甚至使用到北斗导航系统,利用大数据分析比对涉案公司船只的定位信息和采捕作业轨迹,以此作为行政处罚的相关证据。〔2〕《国务院关于加强数字政府建设的指导意见》更是将作者简介:刘东亮,西安交通大学法学院教授;闫玥蓉,西安交通大学法学院硕博贯通制研究生。博士生张楚悦对本文所涉技术问题亦有贡献。〔1〕参见[英]维克托·迈-舍恩伯格、肯尼思·库克耶:《大数据时代》,盛杨燕、周涛译,浙江人民出版社2013年版,第1页。〔2〕参见中国证监会行政处罚决定书(獐子岛集团股份有限公司、吴厚刚等16名责任人员),〔2020〕29号,发文日期:2020年6月15日。另见《獐子岛“扇贝逃跑”被戳穿!证监会卫星查案》,新浪网http://finance.sina.com.cn/stock/relnews/cn/2020-06-24/doc-iircuyvk0296450.shtml,最后访问日期:2022年11月20日。主题研讨24国家检察官学院学报2023年第2期落实大数据战略提升到了推进国家治理体系和治理能力现代化的高度予以全面部署。〔3〕虽然大数据技术已经渗透到社会治理和法律领域,但还是有很多问题存疑。特...