《spss数据的结构和定义方法.ppt》由会员分享,可在线阅读,更多相关《spss数据的结构和定义方法.ppt(16页珍藏版)》请在第壹文秘上搜索。
1、2.2 SPSS数据的结构和定义方法 SPSS数据的结构是对数据的结构是对SPSS每列变量及其每列变量及其相关属性的描述,主要包括相关属性的描述,主要包括变量名、数据变量名、数据类型、变量宽度、变量名标签、变量值标类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量签、显示宽度、缺失值、对齐方式、度量尺度尺度等信息。等信息。 变量名是变量访问和分析的唯一标志。在定变量名是变量访问和分析的唯一标志。在定义义SPSS数据结构时应首先给出每列变量的变量数据结构时应首先给出每列变量的变量名。变量的命名规则如下:名。变量的命名规则如下:1.首字符应以英文字母开头,后面可以跟除了!、?
2、、首字符应以英文字母开头,后面可以跟除了!、?、*之外之外的字母或数字。下划线、圆点不能为变量名的最后一个字的字母或数字。下划线、圆点不能为变量名的最后一个字符。符。SPSS允许用汉字作为变量名。允许用汉字作为变量名。2.变量名的字符个数最好不多于变量名的字符个数最好不多于8个;变量名不区分大小写个;变量名不区分大小写字母。字母。3. SPSS有默认的变量名,以字母有默认的变量名,以字母“VAR”开头,后面补足开头,后面补足5位数字,如位数字,如VAR00001,VAR00012等。变量名不能与等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如内部特有的具有特定含义的保留字同名,如
3、ALL,BY,AND,NOT,OR等。等。4.变量名最好与其代表的数据含义相对应,每个变量名必须变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。具有唯一性。变量名(Variable name)数据类型(Type) 数据类型是指每个变量取值的类型。数据类型是指每个变量取值的类型。SPSS中中有三种基本数据类型:有三种基本数据类型:数值型、字符型和日期型。数值型、字符型和日期型。数值型数值型 (1)标准型()标准型(Numeric) (2)科学记数法型()科学记数法型(Scientific Notation) (3)逗号型()逗号型(Comma) (4)圆点型()圆点型(Dot) (
4、5)美元符号型()美元符号型(Dollar) (6)用户自定义型()用户自定义型(Custom Currency)字符型(字符型(String)日期型(日期型(Date)数值型 数值型是数值型是SPSS最常用的数据类型,通最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。其常由阿拉伯数字和其它特殊符号等组成。其中的标准型(中的标准型(numeric)是)是SPSS默认的数默认的数据类型,默认的显示宽度为据类型,默认的显示宽度为8位,包括正负位,包括正负符号位、小数点和小数位在内,小数位默认符号位、小数点和小数位在内,小数位默认为为2位。如果数据的实际宽度大于位。如果数据的实际宽度大于8位
5、,位,spss将自动按照科学计数法显示,数据的将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的显示并不影响数据的存储,也不影响数据的计算。计算。字符型(String) 字符型也是字符型也是SPSS较常用的数据类型,较常用的数据类型,由一个字符串组成。如职工号码、姓名、地由一个字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为数据的默认显示宽度为8个字符,不能够进个字符,不能够进行算术运算,行算术运算,并区分大小写字母并区分大小写字母。字符型数。字符型数据在据在SPSS命令处理过程中应用一对双引号
6、命令处理过程中应用一对双引号括起来,但在括起来,但在输入数据时不应输入双引号输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。否则双引号将会作为字符型数据的一部分。日期型(Data) 日期型数据用来表示日期或者时间,如生日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。日、成立日期等变量可以定义为日期型数据。显示格式:显示格式:dd-mmm-yyyy;mm/dd/yyyy。 列宽度列宽度是数据编辑窗口中显示每列的字符位数。是数据编辑窗口中显示每列的字符位数。显示宽度(Columns)变量名标签(Variable label) 变量名标签是对变量名含义的进
7、一步解变量名标签是对变量名含义的进一步解释说明,它可以增强变量名的可视性和统计释说明,它可以增强变量名的可视性和统计分析结果的可读性。变量名标签可用中文,分析结果的可读性。变量名标签可用中文,总长度可达总长度可达120个字符,但在统计分析结果个字符,但在统计分析结果的显示中一般不能显示如此长的变量名标签的显示中一般不能显示如此长的变量名标签信息。信息。变量值标签(Value label) 变量值标签是对变量取值含义的解释说变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如明信息,对于品质型数据尤为重要,比如1代表男性,代表男性,2代表女性,它不但明确了数据代表女性,它不但明
8、确了数据的含义,也增强了最后统计分析结果的可读的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。性,变量值标签可以用中文。缺失数据(Missing values) 数据中存在明显错误或明显不合理的数据或漏数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不填数据项时统计学上称为不完全数据或缺失数据。完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。采用,要进行说明。SPSS中说明缺失数据的方法中说明缺失数据的方法是是指定用户缺失值指定用户缺失值。这样,。这样,spss在分析时,就能在分析时,就能够
9、将这些缺失值与正常的数据区分开来,并依据够将这些缺失值与正常的数据区分开来,并依据用户指定的缺失值处理策略对其进行处理或分析。用户指定的缺失值处理策略对其进行处理或分析。Spss还有一还有一类默认的缺失值类默认的缺失值,称为系统缺失值,称为系统缺失值,数值型变量用圆点表示,字符型用空格表示。数值型变量用圆点表示,字符型用空格表示。v SPSS中说明缺失数据的基本方法是中说明缺失数据的基本方法是指定用户缺失值。用户缺失值可以是:指定用户缺失值。用户缺失值可以是:o对对字符型或数值型变量字符型或数值型变量,用户缺失值可以,用户缺失值可以是是1至至3个特定的离散值(个特定的离散值(Discrete
10、missing values););o对一对一个数值型变量个数值型变量,用户缺失值可以在一,用户缺失值可以在一个连续的闭区间内并同时再附加一个区间个连续的闭区间内并同时再附加一个区间以外的离散值(以外的离散值(Range plus one optional discrete)。)。 SPSS用户缺失值定义窗口用户缺失值定义窗口变量对齐格式(Align) 定义显示对齐方式,对齐方式分为右对定义显示对齐方式,对齐方式分为右对齐、左对齐和中间对齐,系统中,齐、左对齐和中间对齐,系统中,数值型变数值型变量默认为右对齐,字符型变量默认为左对齐。量默认为右对齐,字符型变量默认为左对齐。度量尺度(Measu
11、re) 统计学依据数据的度量尺度将数据划分统计学依据数据的度量尺度将数据划分为三大类,即为三大类,即定距型数据定距型数据(Scale),如身),如身高、体重;高、体重;定序型数据定序型数据(Ordinal),如职),如职称、职务、对某事物的赞同程度;称、职务、对某事物的赞同程度;定类型定类型数据(数据(Nominal),如民族、宗教信仰、性),如民族、宗教信仰、性别、党派。定距型数据通常指连续型数据别、党派。定距型数据通常指连续型数据;定序型数据具有内在固有大小或高低顺序,定序型数据具有内在固有大小或高低顺序,但它又不同于定距型数据,一般可以用但它又不同于定距型数据,一般可以用数数值或字符值或
12、字符表示表示;定类型数据没有内在固有定类型数据没有内在固有大小或高低顺序,一般以大小或高低顺序,一般以数值或字符数值或字符表示表示的分类数据。的分类数据。 变量结构定义的基本操作变量结构定义的基本操作单击单击Variable View 进入;进入;定义定义变量变量名名定义变定义变量类型量类型定义变量名标签定义变量名标签变量值变量值标签标签定义度量尺度定义度量尺度定义显定义显示宽度示宽度定义定义对齐对齐方式方式 定义变量类定义变量类型对话框型对话框 定义变量值标定义变量值标签对话框签对话框定义变量缺省值定义变量缺省值对话框对话框v通常建立通常建立SPSS数据文件时应首先定义数据数据文件时应首先定义数据的结构部分,然后再输入数据,但实际应的结构部分,然后再输入数据,但实际应用中,边录入、边分析、边修改数据结构用中,边录入、边分析、边修改数据结构的情况也是常见的。数据的结构定义完成的情况也是常见的。数据的结构定义完成之后,可以在之后,可以在Variable View卡片中浏览,卡片中浏览,也可以通过菜单选项也可以通过菜单选项Utilities/ Variable来来实现。实现。