《统计学资料类型.ppt》由会员分享,可在线阅读,更多相关《统计学资料类型.ppt(17页珍藏版)》请在第壹文秘上搜索。
1、第四节第四节 变量及资料类型变量及资料类型变量类型变量类型资料类型资料类型v变量的类型决定资料的类型变量的类型决定资料的类型v一份统计资料中可能包括所有的变量类一份统计资料中可能包括所有的变量类型型一、医药统计中的变量类型一、医药统计中的变量类型v定量变量(数值变量):定量变量(数值变量):其变量值是定量的,其变量值是定量的,表现为数值大小,有度量衡单位。表现为数值大小,有度量衡单位。例如:患者的例如:患者的身高(身高(cm)、体重()、体重(kg)、血压()、血压(mmHg)、脉)、脉搏(次搏(次/分)、红细胞计数(分)、红细胞计数(1012/L)v分类变量:分类变量:表现为互不相容的类别或
2、属性,也表现为互不相容的类别或属性,也称为定性变量。称为定性变量。 分类变量分为分类变量分为无序无序和和有序有序两类:两类:变量按变量值的性质分为不同类型:变量按变量值的性质分为不同类型:无序分类变量:指所分类别或属性之间无程度无序分类变量:指所分类别或属性之间无程度和顺序的差别。按照所分类别或属性的数量,和顺序的差别。按照所分类别或属性的数量,还可以细分为:还可以细分为:二分类变量二分类变量,如男、女,中医的虚、实,阴、阳等;,如男、女,中医的虚、实,阴、阳等;多分类变量(名义变量)多分类变量(名义变量),如中医的六气,风、寒,如中医的六气,风、寒、暑、湿、燥、火。、暑、湿、燥、火。有序分类
3、变量(等级变量):各类别之间有程有序分类变量(等级变量):各类别之间有程度的差别。度的差别。 如:疾病的严重程度可以分为,轻、中、重;中医如:疾病的严重程度可以分为,轻、中、重;中医辨证中按脉的深浅,可以分为浮、中、沉。辨证中按脉的深浅,可以分为浮、中、沉。变变量量分类变量分类变量定量变量定量变量无序分类变量无序分类变量有序分类变量有序分类变量(等级变量)(等级变量)二分类变量二分类变量多分类变量多分类变量变量类型与资料类型示意图等级资料等级资料计计数数资资料料计量资料计量资料病历号病历号年龄年龄性别性别身高身高cmcm血型血型心电图心电图尿尿WBCWBC职业职业RBC10RBC101212/
4、L/L1 13535女女165165A A正常正常- -教师教师4.654.652 24444男男174174B B正常正常- -工人工人5.215.213 32626男男180180O O正常正常+ +职员职员4.104.104 42525女女161161ABAB正常正常+ +农民农民3.923.925 54141男男171171A A异常异常+工人工人3.493.496 64545女女158158B B正常正常+工人工人5.485.487 75050女女160160O O异常异常+干部干部6.786.788 82828男男176176ABAB正常正常+干部干部7.107.109 93131
5、男男162162O O正常正常+ +军人军人5.245.24变量类型的判断变量类型的判断二、医药统计中的资料类型二、医药统计中的资料类型v定量资料(计量资料或数值资料)定量资料(计量资料或数值资料)v分类资料:分类资料: 分类资料分为分类资料分为计数资料计数资料和和等级资料等级资料两种:两种: 计数资料包括:二分类资料和多分类资料计数资料包括:二分类资料和多分类资料按变量的类型整理成不同资料:按变量的类型整理成不同资料:住院号住院号年龄年龄身高身高体重体重住院天数住院天数职业职业文化程度文化程度分娩方式分娩方式妊娠结局妊娠结局20256552025655272716516571.571.55
6、5无无中学中学顺产顺产足月足月20256532025653222216016074.074.05 5无无小学小学助产助产足月足月20258302025830252515815868.068.06 6管理员管理员大学大学顺产顺产足月足月20225432022543232316116169.069.05 5无无中学中学剖宫产剖宫产足月足月20224662022466252515915962.062.01111商业商业中学中学剖宫产剖宫产足月足月20245352024535272715715768.068.02 2无无小学小学顺产顺产早产早产20258342025834202015815866.06
7、6.04 4无无中学中学助产助产早产早产20194642019464242415815870.570.53 3无无中学中学助产助产足月足月20257832025783292915415457.057.07 7干部干部中学中学剖宫产剖宫产足月足月个体个体individuals变量变量variables 计量资料计量资料 计数资料计数资料实例数据实例数据三类资料间关系三类资料间关系 例:一组例:一组20 40岁成年人的血压岁成年人的血压以以12kPa12kPa为界分为正常与异常两组,统计每组例数为界分为正常与异常两组,统计每组例数 8 低血压低血压 8 8 正常血压正常血压 1212 轻度高血压轻
8、度高血压 1515 中度高血压中度高血压 1717 重度高血压重度高血压计量资料计量资料等级资料等级资料计数资料计数资料第五节第五节 统计工作的基本步骤统计工作的基本步骤 1. 统计设计统计设计:包括调查、实验设计。:包括调查、实验设计。 运用医学统计学的起点,也是高质量地完成整运用医学统计学的起点,也是高质量地完成整个研究的重要基础。个研究的重要基础。2. 收集资料收集资料:在研究设计基础上,通过试验或调在研究设计基础上,通过试验或调查,取得准确可靠的原始资料查,取得准确可靠的原始资料3. 整理资料整理资料:对资料进行清理、改错,数量化对资料进行清理、改错,数量化4. 分析资料分析资料:包括
9、统计描述、统计推断包括统计描述、统计推断 将所得数据进行统计学处理的过程将所得数据进行统计学处理的过程5. 5. 作结论:作结论:在数据分析的基础上,应用统计学处在数据分析的基础上,应用统计学处 理的结果,进行统计学推断。同时,依据相应的专理的结果,进行统计学推断。同时,依据相应的专业知识,作出专业性的结论业知识,作出专业性的结论第六节第六节 SPSS统计软件说明统计软件说明SPSS-Statistical Package for Social Science (社会科学统计软件包)现改名(社会科学统计软件包)现改名为为Statistical Product and Service Solut
10、ions(统计产品与服务解决方案)统计产品与服务解决方案)1. 20世纪世纪60年代末,美国斯坦福大学的三位年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件研究生研制开发了最早的统计分析软件SPSS,同时成立了,同时成立了SPSS 公司公司2. 1975 年在年在芝加哥组建了芝加哥组建了SPSS 总部总部 3. 1984年开发了年开发了DOS操作系统下的操作系统下的PC+1.0版本版本4. 1992年的年的DOS版升级为版升级为Windows版本,版本,即最初的即最初的4.0版版5. 1999年升级到年升级到10.0版、版、2001年升级为年升级为11 .0版、版、 2003年年
11、 Windows操作平台下的最操作平台下的最新版本为新版本为12.0;目前已开发目前已开发14.0、15.0与著名统计软件与著名统计软件SAS相比,更适用于统计初相比,更适用于统计初学者或非统计学专业人员学者或非统计学专业人员SPSS软件的特点软件的特点v 操作简便,方便自学操作简便,方便自学。v 数据转换功能较强数据转换功能较强:可存取和转换多种数可存取和转换多种数据类型,如据类型,如Spss(*.sav),),Excel(*.xls),Text(*.txt) , dBase(*.dbf) 文件等。文件等。v 数据管理功能强大且操作直观数据管理功能强大且操作直观:在基本界面在基本界面上集数据
12、录入、转换、检索、统计分析、作上集数据录入、转换、检索、统计分析、作图、制表及编辑等功能于一身;图、制表及编辑等功能于一身;v 可用可用SPSS命令编程,形成命令编程,形成SPSS环境下的环境下的可执行文件可执行文件。 SPSS软件的特点软件的特点v 统计分析方法比较全面统计分析方法比较全面:包括一般统计描述、包括一般统计描述、简单列联表分析、均数比较、一般线性模型、混简单列联表分析、均数比较、一般线性模型、混合模型、相关回归、对数线性模型、聚类和判别合模型、相关回归、对数线性模型、聚类和判别、因子分析、非参数检验、时间序列、生存分析、因子分析、非参数检验、时间序列、生存分析及缺失值估计等内容;及缺失值估计等内容;vSPSS结果输出的管理也很有特色结果输出的管理也很有特色;v绘图和图形编辑功能也很方便、全面。绘图和图形编辑功能也很方便、全面。报告描述统计量报表均数比较通用线性模型混合模型相关回归对数线性模型聚类数据简化标度非参数检验时间序列生存分析多重响应分析条图三围条图线图面积图饼图高低图箱图误差图人口金字塔散点图直方图图形