mr.myself吧 关注:38贴子:3,190
  • 0回复贴,共1

2
SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,其中的数据结构记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等必要信息,数据的内容才是那些待分析的具体数据。基于上述特点,建立SPSS数据文件时应完成两项任务,即描述数据的结构和录入编辑数据。
数据编辑窗口中的一行称为一个个案或记录(Case),所有个案组成SPSS数据文件的内容。数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。 SPSS数据文件的结构就是个变量及相关特征的描述。
频数数据的组织方式下:“一行”为变量(多变量交叉分组下)的一个分组;“一列”为一个变量,代表了某个问题及相应的计数结果。
SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、度量尺度等信息。SPSS数据的结构的定义在变量视图(variable view)中实现。
变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:首字符以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符;变量名的字符个数最好不多于8个;变量名不区分大小写字母;SPSS允许用汉字作为变量名,汉字总数最好不超过4个;SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。
数值型是SPSS最常用的数据类型,通常由阿拉伯数字和其它特殊符号等组成。
标准型(numeric)是SPSS默认的数据类型,默认的显示宽度为8位,包括正负符号位、小数点和小数位在内,小数位默认为2位。如果数据的实际宽度大于8位,spss将自动按照科学计数法显示,数据的显示并不影响数据的存储,也不影响数据的计算。
字符型也是SPSS较常用的数据类型,由一个字符串组成。如职工号码、姓名、地址等变量都可以定义为字符型数据。字符型数据的默认显示宽度为8个字符。不能够进行算术运算,并区分大小写字母。字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。
日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy。
变量宽度(Width)是变量允许的最大字符位数列宽度(Columns)是显示宽度,是数据编辑窗口中显示每列的字符位数。通常变量宽度(Width)和显示宽度(Columns)是一致的。小数位宽(Decimals)代表精度,默认值为2位。
变量名标签是对变量名含义的进一步解释说明;作用:增强变量名的可视性和统计分析结果的可读性。
变量值标签是对变量取值含义的解释说明信息,对于品质型数据尤为重要,比如1代表男性,2代表女性,它不但明确了数据的含义,也增强了最后统计分析结果的可读性,变量值标签可以用中文。
数据中存在明显错误或明显不合理的数据或漏填数据项时统计学上称为不完全数据或缺失数据。数据中如果存在缺失数据,分析时通常不能直接采用,要进行说明。SPSS中说明缺失数据的方法是指定用户缺失值。spss在分析时,就能够将这些缺失值与正常的数据区分开来,并依据用户指定的缺失值处理策略对其进行处理或分析。Spss还有一类默认的缺失值,称为系统缺失值,数值型变量用圆点表示,字符型变量中的空格不是系统缺失值。
定距型数据(Scale),如身高、体重、人数和件数等连续型或离散数值型数据;
定序型数据(Ordinal),如职称、职务、对某事物的赞同程度;定序型数据具有内在固有大小或高低顺序,一般可以用数值或字符表示;
定类型数据(Nominal),如民族、宗教信仰、性别、党派;定类型数据没有内在固有大小或高低顺序,一般以数值或字符表示的分类数据,是名义指代。
将数据保存为Excel文件格式时,Write
variables names to spreadsheet选项呈可用状态,它的作用是指定是否将SPSS变量名写入Excel工作表的第一行
如果Excel工作表文件第一行或指定读取区域内的第一行存储了变量名信息,则应选择Read variable names项,即以第一行的文字信息作为SPSS的变量名,否则不选。
从外部数据文件中增加个案到当前数据文件中,称为纵向合并,相互合并的数据文件应该有相同的变量。
从外部数据文件增加变量到当前数据文件,称为横向合并,横向合并文件时要注意以下三个问题:1、 相互合并的数据文件必须至少有一个名称相同的变量,该变量是两文件横向合作的依据,称为关键变量;2、两个数据文件都必须先按关键变量进行升序排列;3、不同数据文件中数据含义不相同的数据项变量名不应相同。



1楼2011-12-27 21:28回复