数据处理与分析.ppt

上传人:p** 文档编号:180348 上传时间:2023-03-27 格式:PPT 页数:53 大小:802KB
下载 相关 举报
数据处理与分析.ppt_第1页
第1页 / 共53页
数据处理与分析.ppt_第2页
第2页 / 共53页
数据处理与分析.ppt_第3页
第3页 / 共53页
数据处理与分析.ppt_第4页
第4页 / 共53页
数据处理与分析.ppt_第5页
第5页 / 共53页
数据处理与分析.ppt_第6页
第6页 / 共53页
数据处理与分析.ppt_第7页
第7页 / 共53页
数据处理与分析.ppt_第8页
第8页 / 共53页
数据处理与分析.ppt_第9页
第9页 / 共53页
数据处理与分析.ppt_第10页
第10页 / 共53页
亲,该文档总共53页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《数据处理与分析.ppt》由会员分享,可在线阅读,更多相关《数据处理与分析.ppt(53页珍藏版)》请在第壹文秘上搜索。

1、数据处理与分析 数据资料的统计分析 SPSS软件应用 课题的分析报告数据的统计描述 统计描述方法是研究简缩数据并描述这些数据的统计方法。将搜集来的数据资料加以整理、归纳和分组,简缩成易于处理和便于理解的形式,并计算所得数据的各种统计量,如平均数、标准差以及描述有关实务和现象的分布情况、波动范围和相关程度等,以揭示其特点和规律。数据资料的整理与表示数据检查 主要检查数据的完整性和正确性数据分类 把搜集的数据进行分组归类。数据分类要做到既不重复、不遗漏,又不混淆。一般可分为品质分类和数量分类。数据排序 将各数据从大到小或从小到大进行排列,包括等级排列和次数排序。数据统计表 就是把所研究的教育技术现

2、象和过程的数字资料以简明的表格形式表现出来。数据的图示法是利用几何图形或其他图形的描绘,把所研究对象的特征、内部结构、相互关系和对比情况的等方面的数据资料绘制成整齐简明的图形,它是以说明研究对象和过程的量与量之间的对比关系的一种方法。在教育技术研究中,常用的图形有条形图、曲线图、直方图和圆形图。特征参数的计算 集中量数 差异量数 标准分数 为了分析研究对象的特征,不必对总体中每一个单位都进行研究。而是通过抽样的方法,按照随机性原则,只从全部对象中抽取部分单位(样本组)加以研究。对于每组样本,首先应对其特征参数进行计算,以给出整体特征的统计描述,并根据统计数据,对总体对象做出具有一定结构的估计和

3、推测。常用的特征参数包括:集中量数 算数平均数,用 表示, 设 为各次观察的结果,则有 中数,是指一组按大小数序排列起来的量数的中间点的数,又称中位数,用Mdn来表示。 众数,是指一列数中出现次数最多的数值,常用M表示。1xnx2xx121.ninixxxxXnn差异量数差异量数是表示数之间差异程度的一些统计量的总称,它用以表示一群量数的离散情况或集中趋势。集中量数在量尺上是一个点,表示各量数所在的位置。差异量数在量尺上是一段距离,表示一个量数与另一个量数或中心点之间的距离。只有知道了差异量数的大小,才能了解集中量数的代表性如何。差异量数愈大,集中量数的代表性愈小;差异量数愈小,则集中量数的代

4、表性愈大。在统计分析中经常采用的是标准差,它是与平均数的平方和之平均数的算数平方根。2()iXxSn标准分数 标准分数,又称Z分数,是以标准差为单位所表示的一个分数在团体分数中所处的位置。 标准分数的计算公式为XXZS次数分布 次数分布又称次数分配,是指总体或样本按随机变量(数据)大小次序在出现频率上的排列,一般采用次数分布表、次数分布直方图或次数分布曲线来表示。总体水平特征分析X-S平面分析模型 0102030405060708090100024681012141618第一象限第二象限第三象限第四象限不稳定状态不稳定状态最差状态最佳状态 平均水平低,且较分散,存在高分生 平均水平高,但较分散

5、,存在低分生 平均水平低,且相对集中平均水平高,且相对集中XS各层次分布特征分析利用正态分布进行层次分析 正态分布是一种理论分布,在次数分布中,中间的次数多,由中间往两边的次数逐渐减少,往两边的次数多少是相等的。根据正态分布绘制的曲线称为正态分布曲线。其特点是中间成一高峰,由高峰向两侧逐渐下降,先向内弯,后向外弯,降低的速度是先慢后快,最后达到接近底线,但永远不与底线相交,形成一个单峰的对称的钟形形态。正态分布21标准差相同,均值不同,曲线不同均值为0,标准差不同,曲线形状比较教育技术研究数据的统计检验 统计检验是先对总体的分布规律作某种假说,然后根据样本所提供的数据,进行统计运算,根据运算结

6、果,对假说做出肯定或否定的决策。统计检验的一般步骤如果要检验实验组和对照组的平均数(u1和u2)是否存在差异,步骤如下;(1)建立虚无假设,即先认为两者没有差异,用H0:u1=u2表示。(2)通过统计运算,确定假设H0成立的概率P。(3)根据P的大小,判断假设H0是否成立,如下图所示P值H0成立概率的大小差异程度P=0.01H0成立概率极小差异非常显著P0.05H0成立概率较大差异不显著自由度 统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的资料的个数。u 在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自

7、由度为n。 u 在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。 差异程度检验的分类 大样本平均数差异程度检验 小样本平均数差异程度检验 计数资料的差异检验大样本平均数差异程度检验 大样本平均数差异程度检验又称Z检验。Z检验法适用于大样本(样本容量大于30)的两个平均数之间差异显著性检验的方法。它通过计算两个平均数之差Z分数来与所规定的理论Z值相比较,看是否大于所规定的理论Z值,从而判定两平均数的差

8、异是否显著的一种差异显著性检验方法,步骤如下:(1)建立虚无假设H0:u1=u2,即先假定两个平均数之间没有显著差异。(2)计算统计量Z值,对于不同类型的问题选用不同的统计量计算方法。(3)将计算所得Z值与理论Z值进行比较,推断发生的概率,依据Z值与差异程度显著性关系表做出判断,如下表(4)根据以上分析,结合具体情况,得出相关结论。|Z|P值差异显著程度|Z|=2.58p=1.96p=0.05差异显著|Z|0.05差异不显著 大样本平均数差异程度检验(1)如果检验一个样本平均数 与一个已知的总体平均数u0的差异是否显著,其Z值计算公式为(2)如果检验来自两个组样本平均数的差异性,从而判断其各自

9、所代表的总体的差异是否显著,其Z值计算公式Z检验的计算公式0XuSnZX22121212XXZnnss差异程度检验的分类 大样本平均数差异程度检验 小样本平均数差异程度检验 计数资料的差异检验小样本平均数差异程度检验 小样本平均数差异程度检验又称t检验,t检验用于小样本(样本容量小于30)时两个平均值差异程度的检验方法。它 用t分布理论来推断差异发生的概率,从而判定两个平均数的差异是否著。小样本平均数差异程度检验一般步骤如下:(1)建立虚无建设H0:u1=u2,即先假定两个总体平均数之间没有显著差异。(2)计算统计量t值,对于不同类型的问题,选用不同的统计量计算方法。(3)根据自由度df=n-

10、1,查t表,找出规定的t理论值并进行比较。理论值差异的显著水平为0.01级和0.05级。不同自由度的显著水平理论值记为t(df)0.01和t(df)0.05。(4)计算所得的t值和理论t值,推断发生的概率,依据下表t值与差异程度显著性关系表做出判断(5)根据以上分析,结合具体情况,结合具体情况,得出结论。tP值差异显著程度t=t(df)0.01p=t(df)0.05p=0.05差异显著T0.05差异不显著t值的计算公式(1)要判断一个总体中的小样本平均数与总体样本平均值之间的差异程度,其统计量t值的计算公式为(2)如果要判定两组样本平均数之间的差异程度,其统计量t值的计算公式为01SnXut2

11、21212121212*2*XXtnnnnnnxx22差异程度检验的分类 大样本平均数差异程度检验 小样本平均数差异程度检验 计数资料的差异检验计数资料的差异检验 计数资料的差异检验又称卡方检验。即 检验。 检验用于具有明显分类特征的某种数据,用来检验属于某一类别的对象或反映个案数与根据零假设所得期望数之间是否存在显著差异。 检验是对所得到的分类,分等的技术资料与依据某种假设所期望的理论次数二者之间进行差异显著性检验的方法。2x2x2x计数资料的差异检验其一般步骤如下:(1)建立虚无假设H0:f0=f0。(2)计算统计量 值,计算公式为(3)按类别项目的自由度df=n-1或df=(n1-1)(

12、n2-1)查df(0.01)和df(0.05)的数值表,找出理论值 值。(4)比较判断,把计算所得的 值与查表所得的理论 值进行比较,依据 值与差异显著性关系表判断检验结果,如表所示:(5)根据以上分析,结合具体情况,得出结论。22()0.01dfxx2x2x202()efeffx2x2x2xtP值差异显著程度p 0.01差异非常显著P 0.05差异显著P0.05差异不显著22()0.05dfxx22()0.05dfxx2检验的意义 检验一个因素两项或多项分类的实际观察数与某理论次数分布是否相一致的问题(配合度检验或无差假说检验 ) 。 检验两个因素各有多项分类之间是否有关联或是否具有独立性的

13、问题(独立性检验 ) 。 2检验应用于计数数据的分析,对于总体的分布不作任何假设,故是非参数检验方法。 信度 信度(reliability)所关心的是测验分数的一致性或稳定性。 一个具有良好信度的测验,使用在不同的主试者、评分者、时间、情境或使用类似的问题,其所得的分数应该接近相同或一致。 一般而言分数愈一致,受误差的影响愈小。所以信度主要在说明测验分数中测量误差所占的成分。信度的类型 重测信度 在不同的时间使用同一份问卷,对同一集体的受试者进行的重复测验,所得到的两组考试分数之间的相关系数,即为重测信度系数。这种信度表示测验结果有无变动,反映测验分数的稳定程度,又叫稳定系数。 复本信度 同一

14、集体的学生几乎同时进行的,质量相等的两份试卷的两次考试分数之间的相关性,即为复本信度系数。 分半信度 将 一个测验分为质量相等的两部分并同时进行测验,这两部分测验分数的相关系数就叫分半信度系数 库李信度 库德和李查逊在1937年设计一种分析项目间一致性以估计信度的方法。可避免由于任意两半分而产生的偏差。 信度系数 适于既有主观题又有客观题的测验 评分者信度 是从测验卷中抽取一些样本,单独有两位评分者在每份测验卷上评分,然后根据他们的分数求相关。适于主观题信度系数 在态度量表法常用的检验信度的方法是克朗巴何(Cronbach)所创的系数:22()(1)1inanSS为信度系数,n为试题总数, 为

15、测验总分的方差, 是第i道题的方差2S2iS信度的意义 测量的一致性相同的个人在不同的时间,以相同的测验测量,或以复本测验测量,或在不同的情境下测量,所得结果的一致性。两次测验的结果相当一致,表示测验分数具有稳定性、可靠性、可预测性 测量的误差信度是在估计测量的误差有多少,以及有多少比率是由测量误差所造成的。如果测验分数中包含很多的误差成分,信度就低;如果测验分数中包含很少的误差成分,信度就高。效度 效度(validity)是测量的准确性和有效性,也就是测量的结果与所要达到的目标之间相符合的程度。测量的效度与测量的目标有密切关系,效度就是指测验本身所能达到目标的有效程度,一个测验所得结果必须符

16、合该测验的目的,才能成为正确而有效的工具。效度的种类 测验效度既然要视测验达到其使用目的的程度而定,评估一个测验的效度因而不能只看效度的高低,尚需考虑数据是否适合使用的目的。 美国心理学会依目的分为内容效度(Content Validity) 效标关联效度(Criterion-related Validity)结构效度(Construct Validity) 内容效度 指测验内容的代表性或取样的适切性。 考量成就测验的内容效度,需考虑题目能否代表以下因素教学目标教材内容 判断内容效度的方法内容效度没有一个数量的表示方法,他的确定主要是采用逻辑的分析方法,仔细判断每一个题目是否符合教材内容与教学目标。如果测验的题目很能代表教材内容的样本,及所预期的行为改变,而没有其它无关因素(如阅读能力或指导语不清楚)的影响,则表示测验有良好的内容效度。效标关联效度(Criterion-related Validity) 以经验性的方法,研究测验分数与一些外在效标间的关系,故又可称为经验效度或统计效度。 如果测验分数和外在效标的相关愈高,表示测验愈能有效预测外在效标。 外在效标指测验所要预测的某些行为或

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > IT计算机 > 数据挖掘与模式识别

copyright@ 2008-2023 1wenmi网站版权所有

经营许可证编号:宁ICP备2022001189号-1

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。第壹文秘仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第壹文秘网,我们立即给予删除!