SNARC
效应
大小
置信区间
可信
问题
实例
分析
心理学探新2 0 2 3,Vol.43,No.1,77-83PSYCHOLOGICALEXPLORATIONSNARC效应量大小及置信区间的可信问题的实例分析何华(苏州大学教育学院,苏州2 1512 3)摘要:通过实例分析SNARC效应量和置信区间可信度问题。(1)效应量是心理学实验结果报告中一个非常重要的部分,依据SNARC效应量的特殊性提出一种新的统计方法(在线性回归模型中引入混合虚拟变量)处理Aleottia等(2 0 2 0)的开放实验数据,尽管该方法比一般方法更复杂。(2)参数的区间估计是一种基本统计推断形式。根据枢轴量分布,置信区间在一定置信度下可估计总体参数所在的可能范围。文章通过构建一个特殊实例分析了置信区间的估计过程,并和假设检验、贝叶斯统计进行对比分析,结果显示,虽然置信区间可以用来估计参数,但是存在依据某置信区间无法作出正确估计的情况,通过贝叶斯统计能分析出其中原因。关键词:SNARC效应;虚拟变量;假设检验;置信区间;先验分布;后验分布;贝叶斯统计中图分类号:B841.21SNARC效应量大小分析SNARC 效应(spatial-numerical association ofresponse codes effect,SNARC effect)本质上反映的是数量具有空间表征,即,在人脑中存在一条心理数字线,小数(1,2,3,4)表征在左侧空间,而大数(6,7,8,9)表征在右侧空间(Dehaene,Bossini,&Giraux,1993)。其获得的一个最为简单的实验流程为:“+”在屏幕中央呈现30 0 ms,消失后随机出现一个小数(或大数)30 0 ms,被试既快又准确地以双手食指按键判断该数是大于5还是小于5(刺激5不出现在屏幕上)。这个实验用到的任务是数字大小判断(当然还存在其他种类的任务),实验一般采用重复测量实验设计,数据分析采用重复测量方差分析和线性回归分析(Lorch&Myers,1990)。线性回归分析最终会得到一个一元一次线性回归方程,该方程被用来描述SANRC效应。SNARC效应的线性回归方程一般是指,反应时差异(右侧减左侧)在数字(1,2,3,4,6,7,8,9)上的线性回归,并可以一般性的一元一次线性回归模型描述:DRT=o+,N+其中,N为数字1、2、3、4、6、7、8、9,是预测变量;DRT是右侧反应时减去左侧反应时的差值。该线性模型中的回归系数,可以为正或负值,正负表文献标识码:A(1)文章编号:10 0 3-518 4(2 0 2 3)0 1-0 0 7 7-0 7明SNARC效应的方向不同。SNARC效应具有普遍性和跨文化性,西方研究者在以西方人为被试和以数字(1,2,3,4,6,7,8,9)为实验材料时,均可稳定获得数字SNARC效应,在描述SNARC效应的一元一次线性回归方程中,回归系数是负值。而在以希伯来语或波斯语为母语的被试身上,也可稳定获得数字SNARC效应,但方向则和西方人的相反,因此回归系数是正值。SNARC效应的效应量大小就是该线性方程的回归系数大小,或者为该线性方程的斜率的绝对值,与正负号无关。另外,对该方程要进行回归方程的显著性检验和回归系数的显著性检验,检验是欲以证实因变量确实是和自变量呈现线性关系。因为只有一个预测变量,所以这两种检验结果是一致的。查阅国内外文献发现,需要比较SNARC效应量大小的研究为数众多,如,跨通道研究需要比较在单通道和跨通道条件下SNARC效应量大小的改变,以此来判断一个通道的数字加工是否影响到了另一个通道的数字加工;还有,不同空间维度(水平、垂直和矢量维度)的SNARC效应比较,以此来判断哪个维度下的SNARC效应量可能是最大的;另外还有发展性的研究(如,小学生、初中生和大学生),等等。因为具体的研究内容不同,这些研究中*基金项目:江苏省教育学会“十三五”教育科研规划重点课题(19 B1N2SZ18)。通讯作者:何华,E-mail:t o u g a o l u n w e n 2 0 0 6 16 3.c o m。78的SNARC效应量的比较具有各自的具体意义。但是其中的共同之处在于,需要通过考察SNARC效应量的改变来分析出某个自变量因素是否在其中起了作用。另外还有一个统计上的共同需求,就是如何采取合适有效的统计方法来进行比较分析。前述提到的研究中,需要比较的SANRC效应量大小至少是两组之间,这是最少的和最简单的,当然,也可能有四组甚至更多组之间,这种情形就比较复杂了。考虑到简单和具有代表性,选取三组之间的SNARC效应量进行比较分析,而且以Aleottia,G i r o l a m o b,Massaccesic 和Priftis发表在2 0 2 0 年Cognition上的论文“Numbers around Descartes:A preregisteredstudy on the three-dimensional SNARC effect”里的开放式数据为分析对象。分析过程中曾向论文作者Aleottia和Priftis(通讯作者)咨询该研究相关事宜以准确把握其数据含义。Aleottia等(2 0 2 0)的研究是有关数字的三维空间表征问题,为当前首个对三维(水平、垂直和矢量)SNARC效应的研究。Aleottia等(2 0 2 0)指出了前人研究存在的一些问题后,创造性设计出一种特殊反应装置(如下图1所示),真正解决了三维空间上的按键反应问题。研究得到,三维SNARC效应的效应量值是基本相等的(且都是负值),存在三维的数字的心理空间表征。Aleottia等(2 0 2 0)采用了频率主义(经典统计分析)和计算贝叶斯因子两种方法对结果进行了分析并得到最终结论,这两种分析方法下的结果大多完全一致,但从Aleottia等(2020)的结果分析可以看到,在面对经典统计分析下的边缘显著情况,他们都会进一步进行贝叶斯分析以期得到更准确的判断。具体而言,为探索三个空间维度上SNARC效应的情况(即,三个维度上的SNARC效应的效应量或回归系数大小是否有显著差异),Aleottia等(2 0 2 0)进行了如下分析:对每个维度都进行了线性回归分析,并通过经典的单样本t检验和贝叶斯单样本t检验均得到回归方程是显著的。进一步,为了比较三个维度上SNARC效应量大小,Aleottia等(2 0 2 0)通过经典配对样本t检验和贝叶斯配对样本t检验均得到,三个维度上的SNARC效应量大小无显著差异。经典配对样本t检验方法因简便实用而基本为前人研究所采用。但是,多重比较分析容易增加犯I型错误的概率,Ale-ottia等(2 0 2 0)所做经典配对样本t检验存在不可靠的可能性。比较SNARC效应量还可以有其他统计心理学探新思路,如,在线性回归模型中引人虚拟变量方法,下面详细介绍。图1Aleottia等(2 0 2 0)研究中专门设计的反应盒如果两个或多个样本组中的线性模型设定是相同的(即为同向),则这几组之间的回归系数大小是可以比较的,而且这种比较在多数实证分析中都是非常必要的。在数字加工的SNARC效应研究中也存在同样情况。以Aleottia等(2 0 2 0)的研究为例,其实验得到三个维度(水平轴、垂直轴和矢量轴)的SNARC效应量大小显著且方向一致,则可确定数字认知存在心理的三维空间表征,因此比较三个维度(水平轴、垂直轴和矢量轴)的SNARC效应量大小是可行且必要的。由(1)式,三个维度的SNARC效应量的比较其实就是比较如下三个模型的回归系数大小是否存在差异:水平轴SNARC效应模型:DRT=oH+inN+H(1a)垂直轴SNARC效应模型:DRT=ov+ivN+uv(1b)矢量轴SNARC效应模型:DRTs=os+isN+us(1c)考虑到三个模型中的回归系数和常数项不等,采取加法乘法式混合引人虚拟变量得到如下线性模型(Wooldridge,2009/2010)。DRT=Bo+8id,+8,d,*N+8,d,+8fd*N+iN+u2023年第43卷第1期该模型以水平轴为对照,且d1(矢量轴)和d2(垂直轴)均为虚拟变量。当两个虚拟变量都取0时,则表示为水平轴SNARC效应模型,且为对照组;当垂直轴取1,矢量轴取0,则表示为垂直轴SNARC效应模型;当垂直轴取O时,矢量轴取1,则表示矢量轴SNARC效应模型。N为数字1、2、3、4、6、7、8、9。因此,结合两个虚拟变量的不同取值,可得到:水平轴SNARC效应模型(d,=d,=O):DRT=o+,N+矢量轴SNARC效应模型(d=1,d,=0):DRT=(+8)+(82+)N+垂直轴 SNARC效应模型(d,=O,d,=1):DRT=(o+3)+(84+)N+据此,检验垂直轴、矢量轴和水平轴之间的回归系数大小是否存在显著差异,就是检验H。:8 或8 4=0。依此类推,如果(2)式中的虚拟变量d,为水平轴、d为矢量轴,垂直轴为参照记为0,当两个虚拟变量都取0 则表示垂直轴,这样垂直轴就是对照组;当水平轴取1,矢量轴取0,则表示水平轴(d,=1,d=0);当水平轴取0,矢量轴取1,则表示矢量轴(di=0,dz=1)。据此,检验水平轴、矢量轴和垂直轴之间的回归系数大小是否存在显著差异,最终都可归结为检验H:82或4=0。下面即是利用Aleotti等(2 0 2 0)的公开数据通过 SPSS(SPSS Statistics 21,IBM,NY,USA)对模型(2)进行回归分析和F检验,最终得到方差分析表(表1)和两个回归系数表(表2 和表3)。可以看到,不论以哪个轴为参照轴,方差分析表都是相同的(即都是表1形式),这表明存在SNARC效应。而且,当以水平轴为参照时,在回归系数大小比较上,其他两轴均与其无显著差异(表2);当以垂直轴为参照时,在回归系数大小比较上,其他两轴均与其无显著差异(表3)。结果表明,存在数字的空间三维表征。因此,可以看到,通过引入虚拟变量对回归系数大小的分析和Aleotti 等(2 0 2 0)的分析结果是一致的。表1方差分析表平方和df回归23546.837残差7590.847总计31137.684何华SNARC效应量大小及置信区间的可信问题的实例分析(2)非标准化系数标准系数B标准误差(常量)66.406N-11.804d21.50621.374-0.281-1.006d38.79821.374-0.508-1.815d,*N1.006d*N2.417表3回归系数表(垂直轴为参照)非标准化系数标准系数(2a)B标准误差(常量)27.609(2b)N-9.386d38.798d17.292(2c)di*N-2.417d*N-1.411由前面分析可知,引人交乘项检验某个或某几个变量的系数是否存在组间差异,只需在一般线性模型中加人交乘项即可,但这一方法背后存在隐含的假设条件。对于数字认知的SNARC效应的一般线性模型(1)式,这个隐含的假设条件是,三组的误差项应具有相同的分布(因为估计时是将三组样本混合在一起进行估计的),即,o=。国内夏帆(2 0 0 8)给出了证明,一元线性回归模型中引入一个虚拟变量时,其中的虚拟变量回归参数b的显著性检验和两正态独立总体均值比较t检验是等效的。通过前面实例分析得到,混合引入两个虚拟变量后的结果也是等效的。引入虚拟变量的好处之一是可能会减弱假阳性。2置信区间估计的可信问题分析第一部分的分析中提到贝叶斯检验在心理学研究中已开始得到应用。贝叶斯学派认为概率是主观、先验和可变化的,是从有到变化;而频数派认为概率是从无到有到相对稳定,是客观的。若只从客观性角度看,似乎频数派的统计方法的可信度相对更高,但实际情况是否真是如此呢?而且现在心理学实验的检验结果报告除了列出t值(或z值)大小,还需要需要提供“Cohensd值”,也有进一步提均方F54709.36711.1670.00018421.7142379表2 回归系数表(水平轴为参照)Sig.15.1144.3942.6510.8974.4523.7490.0790