_SAS
菜单
操作
第3章 SAS菜单操作,主要内容,3.1 SAS/ASSIST视窗简介3.2 SAS/INSIGHT交互分析简介3.3 SAS/Analyst分析家简介,3.1 SAS/ASSIST视窗介绍,3.1.1 SAS/ASSIST概述为SAS提供了面向任务的菜单界面,借助它可以通过菜单系统使用SAS的其他产品。它自动生成的SAS程序既可辅助有经验的用户快速编写SAS程序,又可帮助用户学习SAS。,选择菜单SolutionsASSIST,则SAS系统将搜索系统中所有可用的SAS数据集。搜索完毕则弹出对话框。菜单显示方式及是否需要开启其他界面,一般采用默认设置,continue,3.1 SAS/ASSIST视窗介绍,主界面,Data Mgmt数据管理,包括创建、导入、导出、编辑、浏览、排序等关于数据集的操作以及SQL语句查询功能。Report Writing:报表制作。Graphics制作统计图。主要有条形图(Bar Charts)、饼图(Pie Chart)、各类散点图(Plots)、地图(Maps)等。Data Analysis统计分析,主要包括离散和连续性变量的描述性统计分析、回归分析、T检验和方差分析、多元分析(包括主成分和因子分析)、质量控制、时间序列等。Planning Tools项目管理工具。EIS基于SAS的二次开发工具。Remote Connect管理本地计算机和远程计算机的SAS对话。,3.1 SAS/ASSIST视窗介绍,Results管理存储在目录文件中的结果。Index提供了ASSIST模块中所有功能的索引,适用于SAS用户入门ASSIST。EXIT退出SAS。其中,最常用的主要是Data Mgmt、Data Analysis和Graphics三个模块。,3.1 SAS/ASSIST视窗介绍,3.1.2 SAS实例分性别描述某班学生英语成绩分布例3-1 已知某初中班级50名学生的英语成绩保存在数据集chap3.example3_1中。其中,id代表学号;sex代表性别:1男性,0女性;score代表英语成绩。请分性别分析学生的英语成绩分布情况。步骤一:Data Analysis|Elementary|Summary Statistics步骤二:Table,选择数据集chap3.example3_1,subset data,选择分类变量sex(同时需要按sex排序)步骤三:Column选择分析变量score,Run|Submit 观察结果窗口,学习Log窗口,3.1 SAS/ASSIST视窗介绍,演示,3.1 SAS/ASSIST视窗介绍,3.2 SAS/INSIGHT交互分析介绍,3.2.1 调用INSIGHT模块 有如下两种方法可以调用INSIGHT模块:方法一:在命令行键入“Insight”方法二:在菜单中选择“Solution(解决方案)”“Analysis(分析)”“Interactive Data Analysis(交互式数据分析)”。这时SAS/INSIGHT必须先选择一个要分析、观察的数据集。如果要生成新数据集,按New按钮,如果要打开已有数据集,按Open按钮。,INSIGHT提供了一个类似于电子表格的数据窗口来管理数据集。下图为显示了数据集SASHELP.CLASS的数据窗口。,3.2 SAS/INSIGHT交互分析介绍,在每一个变量名的上面有两个标签,右边一个代表变量的量测水平,分为区间变量和列名型变量。左边的标签代表变量在分析中的缺省用途,比如Label表示此变量的值在绘图中用来标记观测,Group表示此变量用来分组,等等。在SAS数据集中,变量分为两种类型:字符型变量和数值型变量。在INSIGHT中,为了区分变量在分析中的不同作用,又按变量的测量水平分为两类:(1)区间型变量(interval variable):区间型变量必须是数值型变量,可以对其观测值进行四则运算,计算各种统计量;(2)列名型变量(nominal variable):列名型变量可以是数值型的,也可以是字符型的,在INSIGHT中常起分类作用。,3.2 SAS/INSIGHT交互分析介绍,3.2 SAS/INSIGHT交互分析介绍,3.2.2 功能概述INSIGHT是一个交互式的数据探索和分析的工具,用这一模块可以:通过多窗口连动的图像和分析结果,对数据进行探索;分析单变量分布;用相关和主成分研究多变量间的关系;用方差分析和回归分析拟合变量间关系的模型;INSIGHT的各项功能可以在菜单中找到。,3.2 SAS/INSIGHT交互分析介绍,File新建、打开、保存、打印文件等功能。Edit设定界面(Window子菜单)、转换变量(应用Variables子菜单实现倒数变换、对数变量、开平方、指数变换等)、有关观测的操作(查找观测、在图形和分析中显示/隐藏特定观测等)Analyze作为INSIGHT最重要的分析菜单,通过选择其子菜单可以对应实现的绘图和分析功能。,3.2 SAS/INSIGHT交互分析介绍,INSIGHT的一般操作步骤为:1)打开数据窗口,在数据窗口对数据表进行各种预处理;2)在“Analyze(分析)”菜单中选择相应的菜单项,进行分析;3)查看各种分析结果。,3.2 SAS/INSIGHT交互分析介绍,3.2.3 数据的预处理操作(SASHELP.CLASS)1.在数据窗中移动列 1)单击数据窗口左上角处的三角按钮,打开数据窗菜单,选择“Move to First(移到最先)”,在弹出的“Move to First”对话框中,选择欲移动到首列的变量,单击“OK”按钮,即可将该变量移到第一列。将某个变量移到最后一列(Move to Last)的操作,可类似进行。2)移到某两列中间:选择主菜单“Edit”“Windows”“Tools”,打开“Tools”对话框。单击手形按钮,光标变为手形,鼠标指向移动变量的顶部,按住鼠标左键拖动到适当的地方即可,3.2 SAS/INSIGHT交互分析介绍,2.对数据集排序 单击数据窗口左上角处的三角按钮,打开数据窗菜单,选择“Sort”,在打开的“Sort”对话框中,选择排序的变量,单击“Y”按钮,将变量选定,然后按“OK”按钮即可。可同时根据多个变量进行排序,默认是升序排序,可单击Asc/Des切换到降序。,3.2 SAS/INSIGHT交互分析介绍,3.创建新的变量 选择主菜单“Edit”“Variables”“Other”,打开“Edit Variables”对话框,可通过原变量的关系定义新的变量。如:根据学生体重与身高之比建立新变量D_weight:1)选中变量weight,单击“Y”,选中变量height,单击“X”;2)在“Transformation”列表框中选择运算:Y/X;3)在“Label”栏中注明:体重身高比;4)最后单击“OK”按钮,即可增加新变量列。,3.2 SAS/INSIGHT交互分析介绍,4.建立数据集的子集 下述方法可以建立当前已打开数据集的子集。如欲找出所有男生的观测:1)选择主菜单“Edit”“Observations”“Find”,打开“Find Observations”对话框,确定建立新数据表的关系式;2)在变量名称列表中选择sex,在Value(值)列表中选择M,单击“OK”按钮;数据窗口中所有男生的观测被选中;3)单击数据窗口左上角处的三角按钮,打开菜单,选择“Extract”,生成新数据集;4)若要保存数据集,选择菜单“File”“Save”“Data”,在打开的“Save Data”对话框中选择保存的逻辑库名,并输入数据集名,单击“OK”按钮即可。,3.2 SAS/INSIGHT交互分析介绍,5.直接输入数据建立新数据表 在INSIGHT中创建新数据表的步骤如下:1)选择主菜单“File”“New”,即可建立一个新数据集;2)单击数据窗口左上角处的三角按钮,打开菜单,选择“New Variables”,在打开的对话框中输入变量个数;再选Define Variables,在打开的对话框中输入变量名称(Name)及其它属性,单击“OK”按钮即可;3)在单元格内输入数据,每输入一个数据后按Enter键确认;4)选择菜单“File”“Save”“Data”,在打开的“Save Data”对话框中选择保存的逻辑库名,并输入数据集名,单击“OK”按钮即可保存新建的数据集。,课堂练习调用INSIGHT对数据集chap3.ketanglianxi进行预处理,(1)创建新的变量salary,(2)按照id,name,age,sex,salary的顺序排列变量,(3)按照变量age进行排序(升序),(4)建立男员工的子集ketanglianxi_1。,3.2 SAS/INSIGHT交互分析介绍,3.2.4 SAS实例绘制身高和体重的散点图例3-2 已知在某班随机抽查了10个女生,并测量记录其身高和体重,数据保存在数据集chap3.example3_2中。请应用SAS/INSIGHT模块以菜单操作的方式绘制关于女生身高和体重的散点图。步骤一:Solutions|Analysis|Interactive Data Analysis步骤二:Analyze|Scatter Plot 设置height为Y轴,weight为X轴,3.2 SAS/INSIGHT交互分析介绍,3.2 SAS/INSIGHT交互分析介绍,3.3 Analyst(分析家)模块操作,3.3.1 功能概述选择Solutions|Analysis|Analyst菜单进入Analyst分析主界面,菜单介绍:File新建、打开、保存数据集,退出Analyst模块。Edit编辑数据,切换数据集的浏览和编辑模式。View可视化变量,主要包括移动、隐藏、显示变量等。Tools系统全局变量设置,包括输出的标题、视图的设置等。Data数据管理。Reports报表生成。Graphs绘制图形。主要有条形图、饼图、盒形图、散点图、正态概率图(P-P图)、层次图和曲面图。Statistics统计分析。Window界面管理。Help进入帮助系统。,3.3 Analyst(分析家)模块操作,3.3.2 应用Analyst整理数据1.筛选观测例3-3 筛选数据集chap3.example3_2中身高大于165cm的女生,将数据集另存为chap3.example3_3。步骤一:File|Open by SAS name步骤二:Data|Filter|Subset data,变量height,GT(大于)步骤三:CONSTENT enter value,输入165步骤四:File|Save As by SAS name,3.3 Analyst(分析家)模块操作,2.数据排序例3-4 请对数据集chap3.example3_2按照变量weight的值升序排列。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:Data|Sort,选择变量weight,3.3 Analyst(分析家)模块操作,3.数据转换例3-5 根据数据集chap3.example3_2中的信息,新增变量BMI(BMI=weight/(height)*2,其中height的单位为m,weight的单位kg)和变量level,若BMI18.5则level取值为1;若18.5BMI24,则level取值为2;若24BMI28,则level取值为3;若BMI28,则level取值为4;将数据集另存为chap3.example3_5。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:计算BMI的值。Data|Transform|Compute,计算变量BMI,weight/(height/100)*2,注意height单位转换为m步骤三:根据BMI的值新建等级变量level。Data|Transform|Record Ranges步骤四:File|Save As by SAS name,3.3 Analyst(分析家)模块操作,4.产生随机数例3-6 在数据集chap3.example3_5中新建变量score,其取值为一组符合均值为80的泊松分布的随机数,并另存为数据集chap3.example3_6。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:Data|Random Varibles|Possion,新建变量score步骤三:File|Save As by SAS name,3.3 Analyst(分析家)模块操作,5.分组描述统计例3-7 基于数据集chap3.example3_6按照变量level分组计算模拟的变量score的均值和标准差。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:Data|Summarize by groups,将变量level选入Group选项框,变量score选入Summarize选项框,选择Statistics(统计量)选项框内Mean和Standard deviation,3.3 Analyst(分析家)模块操作,6.数据转置例3-8 请将数据集chap3.example3_5按照变量level分类进行转置。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:Data|Transpose,选择height、weight、BMI单击Transpose,将level选入Group By选项框。,3.3 Analyst(分析家)模块操作,7.随机抽样例3-9 在数据集chap3.example3_2中随机抽取4条观测。步骤一:File|Open by SAS name,Edit|Mode|Edit Mode设置编辑模式步骤二:Data|Random sample,Rows为4,3.3 Analyst(分析家)模块操作,8.其他Data|Combine Table(合并数据集):数据集的纵向连接和横向合并Data|Stack column:数据集的堆栈Data|Split column:拆分数据集,3.3 Analyst(分析家)模块操作,3.3.3 应用Analyst进行统计分析菜单StatisticsDescriptive:描述性统计分析Summary statistics描述性统计指标Distributions数据分布Correlation相关分析Frequency Counts频数分析Table Analysis:列联表分析Hypothesis test:假设检验One-Sample Z-test for Mean单样本U检验One-Sample t-test for Mean单样本T检验One-Sample Test for proportion单样本比率检验One-Sample Test for the Variance单样本方差检验Two-Sample t-test for Means两样本T检验,3.3 Analyst(分析家)模块操作,Two-Sample Test for proportion两样本比率检验Two-Sample Test for the Variance两样本方差检验ANOVA:方差分析One-Way ANOVA单因素方差分析Non-parametric One-Way ANOVA非参数单因素方差分析Factorial ANOVA析因设计方差分析Linear Model一般线性模型Pepeated Measures重测数据的方差分析Mixed Model混合模型方差分析Regression:回归分析Simple一元回归(包括直线、抛物线和三次曲线)Linear多元线性回归Logistic逻辑斯蒂回归,3.3 Analyst(分析家)模块操作,Multivariate:多元分析Principal Components主成分分析Canonical Correlation典型相关分析Survival:生存分析Life Tables生命表分析Proportional Hazards相对危险率分析Sample Size:样本量估计主要为在不同的统计模型背景下,根据样本量范围计算相应的统计功效,或者反之,根据设定的统计功效计算达到此统计功效所需要的样本数。,3.3 Analyst(分析家)模块操作,3.3.4 SAS实例探索年龄和血压的相关关系例3-10 已知数据集chap3.example3_10 中包含了随机抽查的15个成人男性的年龄和收缩血压数据。请应用SAS/ANALYST相关模块以菜单操作的方式分别计算年龄和收缩血压的相关系数。步骤一:Solutions|Analysis|Analyze 进入Analyst主界面,File|Open by SAS Name打开数据集example3_10 步骤二:Statistics|Descriptions|Correlations,3.3 Analyst(分析家)模块操作,作业,实验三,