统计分析
综合
实验
1,四川大学工商管理学院 刘 馨 副教授(L),统计分析综合实验,2,统计学常用计算软件,SPSS(Statistical Package of the Social Sciences)(社会科学统计软件包)http:/(Statistical Analysis System)(统计分析系统)http:/.Excel,3,SPSS的统计功能,样本数据的描述和预处理假设检验(包括参数检验、非参数检验和其他检验)方差分析(包括一般的方差分析和多元方差分析)相关分析回归分析聚类分析和判别分析因子分析时间序列分析可靠性分析,4,主要内容,建立数据集数据的描述性分析参数估计假设检验方差分析相关与回归分析统计分析报告,5,参考书目,统计学刘馨 编著 四川大学出版社 2006年统计学实验 冯力 主编 东北财经大学出版社 2008年,管 理 统 计 刘 馨,6,关于考试,以小组为单位,针对某一实际问题,用SPSS软件分析数据,写出统计分析报告。若设计问卷收集数据,每组最多由6位同学组成,若在网上下载数据,每组最多由4位同学组成。,7,统计分析报告的文本格式,标题调查研究的背景与现实意义调查方案的设计(数据来源)数据分析调查结论及相应的建议附件,实验一,8,建 立 数 据 集,9,一、SPSS 窗口介绍,启动后,显示数据编辑器(Data Editor)窗口,10,编辑窗口简要介绍,主菜单栏:将SPSS常用的数据编辑、加工和分析的功能列出来。用户可以通过单击菜单完成相应操作。工具栏:将一些常用的功能用图形按钮的形式组织在工具栏中,使操作更加快捷和方便。数据编辑栏:显示和管理SPSS数据结构和内容。系统状态栏:显示系统的当前运行状态。,11,SPSS输出窗口,主菜单工具栏分析结果显示区状态显示区,12,二、变量类型和定义变量:,定义变量是输入数据的前提。启动后,显示数据编辑器窗口,弹出一个菜单窗口,点击该窗口下方的变量视图,打开如下窗口。,13,14,名称:输入变量名。类型:定义变量类型。分为字符型(String)、日期型(Date)、数值型(Numeric)。标签:进一步说明有关变量的详细含义。数值:对变量值的进一步说明,主要用于对名义级变量和顺序级变量的“值”的说明。缺失:缺失值选择。列:在屏幕上,变量的显示宽度。对齐:显示的对齐方式。测量:选择测度级别,分为刻度级、序次级、名义级。,15,定义变量类型,通常选用数值型:包括正负符号、小数点和小数在内。逗号型:整数部分从个位开始每3位以一个逗号分隔。字符型:由一个字符串组成。,16,说明有关变量的含义,17,缺失值选择,对字符型或数值型,用户缺失值可以是13个特定的离散值。对数值型,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间外的离散值。,18,数据的保存与读取(点击:文件),19,三、读入其他格式的数据,点击:文件 打开 数据 系统弹出一个窗口:,选择文件类型 文件名 打开,20,进一步选择需要的数据:,21,实例:,某证劵公司从某城市有关营业所抽样调查得到散户股民买进、卖出和投资的有关数据,22,练习:某高校10名教师基本情况,实验二,23,数据的描述性分析,24,一、数据特征的描述性分析,1、反映集中趋势的统计量:众数(Mode):全部数据中出现次数最多的数值。中位数(Median):将全部数据按其大小顺序排列,处于中间位置的数值。四分位数(Quartiles):按顺序排列的一组数据被划分为四个相等部分的分割点的数值。平均数(Mean):将全部数据求其平均数。,25,2、反映离中趋势的统计量:,极差(Range):全部数据中最大值与最小值的离差。标准差(Std.deviation):衡量全部数据与其平均数离差程度的重要标准。方差(Variance):标准差的平方。,26,3、反映分布特征的统计量:,偏度(Skewness):是指变量分布非对称的偏态方向程度。数据关于均值对称,斜度为0,否则为右偏(大于0)或左偏。峰度(Kurtosis):是指分布曲线顶峰的尖平程度,即数据集中在平均数周围的变量值的多寡程度。=0,为标准峰度;0,为尖顶峰度;0,为平顶峰度。,27,频数分析表:交叉列联表:列联表(cross tabulations)是用来描述两个或两个以上变量的联合分布的统计表。从中可以分析变量之间的相关关系。,4、常用的统计表,28,条形图(Bar Chart)用宽度相同的条形的高度和长度表示次数分布。饼图(Pie Chart)用圆形及圆内扇形的面积来表示次数分布 直方图(Histogram)用直方图的宽度表示不同的区间(组),用竖立于区间上的矩形条,表示相应区间的数值的频次或频率。,5、统计图,29,箱形图(Boxplot)综合表述样本数据的中心特征和离散特征,显示数据的中心、范围、分布的主要特征。箱形图的基本构造:,下四分点,中位数,上四分点,极差,本体极大值,本体极小值,二、用SPSS作描述性分析,1、给变量值排序:在读入数据后,从主菜单数据开始,依次点击:数据 对个案排序 系统弹出一个窗口,30,31,从左边框中的变量清单中,选取所要排序的变量送入右边的框中,在窗口的下部,选升序或降序。,32,2、给变量值排名次:,在读入数据后,从主菜单转换开始,依次点击:转换 个案排秩 系统弹出一个窗口可直接排名次,也可分组排名次,33,选取所要排序的变量,送入右边上面的变量框,可直接排名次,若选取所要分类的变量,送入右边标准框,可分类排名次。,34,实例:3.6根据某班学生的数据,进行身高排序;将学生的身高数据,按不同性别分组排名次。,练习:根据某地区推销员的销售数据,进行排序;将推销员的销售数据,按不同地区分组排名次。,35,3、频次、频率分析,中心描述与离散描述:,频次分析摸块(Frequency Process)不仅能分析样本数据的频次、频率,还可以统计出样本数据的均值、中位数、众数,极大值、极小值、上下四分点、极差、方差、标准差、均值标准差,以及斜度、峰度等。在读入数据后,依次点击:分析 描述统计 频率 系统弹出一个窗口,36,点击该窗口下面的统计量按钮,弹出一个新窗口,37,38,在主窗口,点击图表按钮,弹出一个新窗口,上块为图形类型选择块;下块为图的纵轴值选择块;,39,在主窗口,点击格式按钮,弹出一个新窗口,40,实例:,从某城市抽出来的30个商店中,查出某商品的价格数据(刻度级数据),进行频次分析。练习:抽样调查某单位16人的受教育程度的数据(顺序级数据),进行频次分析。,41,4、列联表分析,读入数据后:点击分析 描述性统计 交叉表 系统弹出一个对话窗口。,42,43,点击单元格按钮,弹出一个新窗口,