《数据统计与分析.ppt》由会员分享,可在线阅读,更多相关《数据统计与分析.ppt(77页珍藏版)》请在第壹文秘上搜索。
1、数据统计与分析统计学的定义:p是研究如何收集、整理、分析数据的一门科学。p寻找、预测、确定随机现象中所呈现的统计规律。 p被称为数字的科学。 o 1、搜集数据;o 2、整理数据分组、统计表、统计图、综合指标等;o 3、统计分析运用统计方法及分析对象的有关知识,从定量与定性的结合上进行研究。统计分析可以把数据、情况、问题、建议等融为一体。是发挥统计的信息、咨询、管理、监督和决策功能的重要内容。统计工作的步骤第一章 统计方法一、一、什么是统计方法二、统计方法的性质三、统计方法的用途四、统计方法的作用五、统计方法应用的基本条件一、什么是统计方法统计方法统计方法:是指有关收集、整理、分析和解释统计数据
2、,并对其所反映的问题作出一定结论的方法。统计描述:统计描述:是对统计数据进行整理和描述的方法;常用曲线、表格、图形等反映统计数据和描述观测结果,以使数据更加容易理解,例如,可将统计数据整理成折线图、曲线图和频数直方图等。统计推断:统计推断:通过对数据的分析和统计运算所得到的特性值,对事物的状态和发展趋势进行预测和推断。又称归纳统计法。 统计控制:统计控制: 通过对数据的整理、分析和统计计算所得到的结果,评价事物状态、监测变异,从而保持控制过程处于稳定的状态。二、统计方法的性质1. 描述性利用统计方法对统计数据进行整理和描述,以便展示统计数据的的规律;统计数据可用数量值加以度量,如平均数、中位数
3、、级差和标准差等,亦可用统计图表予以显示,如条形图、折线图、圆形图、频数直方图、频数曲线等。2. 推断性统计方法都要通过详细研究样本来达到了解、推测总体状况的目的,因此它具有由局部推断整体的性质。3. 风险性统计方法既然要推断用部分整体,那么这种由推断而得出的结论就不会是百分之百正确,即可能有错误。犯错误就要担风险。三、统计方法的用途o1.1. 提供表示事物特征的数据;(平均值、中位数、标准偏差、方差、极差)o2.2. 比较两事物的差异;(假设检验、显著性检验、方差分析、水平对比法)o3.3. 分析影响事物变化的因素; (因果图、调查表、散布图、分层法、树图、方差分析)o4.4. 分析事物之间
4、的相互关系; (散布图、试验设计法)o5.5. 研究取样和试验方法,确定合理的试验方案;(抽样方法、抽样检验、试验设计、可靠性试验)o6.6. 发现质量问题,分析和掌握质量数据的分布状况和动态变化;(频数直方图、控制图、排列图)o7.7. 描述质量形成过程。(流程图、控制图)o 评价过程质量的控制状态。o 预防不合格品的发生或再发生。o 降低检验成本。o 揭示产品不合格的原因或主要原因四、统计方法的作用 :形成产品质量、谋求改进机会、进行质量管理的重要形成产品质量、谋求改进机会、进行质量管理的重要方法、工具。方法、工具。五、统计方法应用基础条件:1.基本条件:p 过程稳定处于受控状态 p 必要
5、的资源:计量工具; 检测手段; 记录图表; 高素质员工。2.基础工作:p 建全规范的管理体系或制度;p 产品质量可追溯;p 计算机技术的应用:如 MINITAB 软件。第二章 统计数据的运用数据的收集、整理与图示方法第一节 统计数据及其分类一、计量数据凡是可以连续取值的,或者说可以用测量工具具体测量出小数点以下数值的这类数据。如:长度、容积、质量、化学成分、温度、产量、职工工资总额等。计量数据一般服从正态分布。二、计数数据凡是不能连续取值的,或者说即使使用测量工具也得不到小数点以下数值,而只能得到0或1,2,3等自然数的这类数据。记件数据一般服从二项式分布,记点数据一般服从泊松分布。第二节 总
6、体与样本p总体(母体):总体(母体):是指在某一次统计分析中研究对象的全体。p个体:个体:组成总体的每个单元(产品)叫做个体。p总体含量(总体大小):总体含量(总体大小):总体中所含的个体数,常用N表示。p样本容量(样本大小):样本容量(样本大小):样本中所含的样品数目,常用n表示。p抽样抽样:是指从总体中随机抽取样品组成样本的活动过程。p随机抽样:随机抽样:是指要使总体中的每一个个体(产品)都有同等机会被抽取出来组成样本的活动过程。p样本(子样):样本(子样):是指从总体中随机抽取出来并且要对它进行详细研究分析的一部分个体(产品);样本是由1个或若干个样品组成的。第三节 抽样方法o1、简单随
7、机抽样法又叫随机抽样法,是指总体中的每个个体被抽到的机会是相同的。优点:抽样误差小。缺点:抽样手续比较繁杂。o2、系统抽样法又叫等距抽样法或机械抽样法。优点:操作简便,实施不易出差错。缺点:容易出较大偏差。p3、分层抽样法也叫类型抽样法。它是从一个可以分成不同于总体的总体(或称为层)中,按规定的比例从不同层中随机抽取样品(个体)的方法。优点:样本的代表性比较好,抽样误差比较小。缺点:抽样手续较简单随机抽样还要繁杂。适用场合:常用于产品质量验收。o4、整群抽样法又叫集团抽样法。是将总体分成许多群,每个群由个体按一定方式结合而成,然后随机抽取若干群,并由这些群中的所有个体组成样本。优点:抽样实施方
8、便。缺点:代表性差,抽样误差大。适用场合:常用在工序控制中。案例 某种成品零件分装在20个零件箱装,每箱各装50个,总共是1000个。如果想从中取100个零件作为样本进行测试研究。 简单随机抽样简单随机抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法从中抽出编号毫无规律的100个零件组成样本。 系统抽样系统抽样:将20箱零件倒在一起,混合均匀,并将零件从1 1000编号,然后用查随机数表或抽签的办法先决定起始编号,按相同的尾数抽取100个零件组成样本。分层抽样分层抽样:20箱零件,每箱都随机抽取5个零件,共100个组成样本。整群抽样整群抽样:先从2
9、0箱零件随机抽出2箱,该2箱零件组成样本。第四节 统计特征数o一、样本平均值o二、样本中位数o三、样本方差o四、样本标准偏差o五、样本极差表示数据的集中位置表示数据的离散程度一、样本平均值niixnx1_1如果从总体中抽取一个样本,得到一批数据X 1,X 2,X 3.X n,则样本的平均值 :样本的算术平均值;n :样本大小。二、样本中位数把收集到的统计数据X 1,X 2,X 3.X n,按大小顺序重新排列,排在正中间的那个数就叫作中位数,用符号 来表示。当 n 为奇数时,正中间的数只有一个;当 n 为偶数时,正中间的数有两个,此时,中位数为正中两个数的算术平均值。三、样本方差样本方差是衡量统
10、计数据分散程度的一种特征数,其计算公式:S S 2 :样本方差;:某一数据与样本平均值之间的偏差。四、样本标准偏差国际标准化组织规定,把样本方差的正平方根作为样本标准偏差,用符号 S S 来表示。其计算公式:五、样本极差极差是一组数据中最大值与最小值之差。常用符号 R 表示,其计算公式:R = X max - - X min第五节 因果图、树图与关联图p一、 因果图p二、 树图p三、 关联图一、 因果图(又称“鱼骨图”)应用因果图的步骤:1)简明扼要地规定结果,即规定需要解决的质量问题;2)规定可能发生的原因的主要类别,这时可以考虑下列因素作为因素的主要类别:数据和信息系统、人员、机器设备、材
11、料、方法、度量和环境等;3)开始画图,把“结果”画在右边的矩形框中,然后把各类主要原因放在它的左边,作为“结果”框的输入;4)寻找所有下一个层次的原因并画在相应的枝上,继续一层层地展开下去。一张完整的因果图展开的层次至少应有二层,一些情况下还可以有一张完整的因果图展开的层次至少应有二层,一些情况下还可以有三层以上。三层以上。画因果图的注意事项:1)画因果图时必须开“诸葛亮会”,充分发扬民主,各抒己见,集思广益,把每个人的意见都一一记录在图上;2)确定要分析的主要质量问题(特性)不能笼统,一个主要质量问题只能画一张因果图,多个主要质量问题则应画多张因果图,因果图只能用于单一目标的分析;3)因果关
12、系的层次要分明,最高层次的原因应寻求到可以直接采取对策为止;4)对分析出来的所有末端原因,都应到现场进行观察、测量、试验等加以确认。因果图常同排列图、对策表联合起来应用。因果图常同排列图、对策表联合起来应用。 实例噪声超标因果图在提高135W电机的一次装机合格率时,运用因果图对 “噪声超标”进行原因分析:噪声超标未按要求做装配经验不足人料环设计转子部件外圆跳动大端盖垂直度不够刚性不够环境噪声大工作间距小定、转子间的间隙小转子外圆大端盖的轴承室与轴承配合不当轴承公差不合理二、 树图树图又叫系统图。用来表示某个质量问题与其他组成要素之间的关系,从而明确问题的重点,寻求达到目的所应采取的最适当的手段
13、和措施的一种树枝状图。树图常用于单目标的展开。树图常用于单目标的展开。树图的主要用途1.企业方针目标实施项目的展开;2.在新产品开发中进行质量设计展开;3.为确保质量保证活动而进行的保证质量要素(事项)的展开;4.对为解决企业内质量、成本、产量等问题所采取的措施加以展开;5.企业承包责任制项目的展开;6.工序分析中对质量特性进行主导因素的展开;7.探求明确部门职能、管理职能和提高效率的方法;8.可以用于因果分析。应用树图的步骤1.简明扼要地讲述清楚要研究的主题(如质量问题);2.确定该主题的主要类别,即主要的层次;3.构造树图,把主题放在左框内,主要类别放在右边的方框内;4.针对这个主要类别确
14、定其组成要素和子要素;5.把针对每个主要类别的组成要素及其子要素放在主要类别右边的方框内;6.评审画出的树图,确保无论在顺序上或逻辑上都没有差错和空档。画树图的注意事项1.用于因果分析的树图一般是单目标的,即一个质量问题用一张树图;2.树图中的主要类别一般可以不先从 5M1E 出发,而是根据具体的质量问题或逻辑关系去选取。实例塑料试片麻坑厚度超差龟裂因果分析数图试片麻坑厚度超差龟裂人员设备工艺原料环境操作不熟练执行工艺不严压力、温度、时间控制不严新调入人员经验少没定机、定人压力不稳定模具不适电热板不平行设备密封不严模具设计不合理电热板间垫层不匀模具厚度大毛坯质量差毛坯厚度偏差大压辊调节不当混炼
15、时间不统一塑化时间不统一塑炼时间不准杂质塑化时间不统一原材料性能不稳定暖气片少没有排风设备工作台不洁室温过高或过低卫生条件差第三节 关联图关联图又叫关系图。它是解决关系复杂、因素之间又相互关联的原因与结果或目的与手段等的单一或多个问题的图示技术,是根据逻辑关系理清复杂问题、整理语言文字资料的一种方法。关联图的基本类型:1.中央集中型:把要分析的问题放在图的中央位置,把同“问题”发生关联的因素逐层排列在其周围。2.单侧汇集型:把要分析的问题放在右(或左)侧,与其发生关联的因素从右(左)向左(右)逐层排列。第三节 关联图关联图的用途:1.制定全面质量管理计划;2.制定质量方针;3.制定生产过程的质
16、量改进措施;4.推进外购、外协件的质量管理工作;5.制定质量管理小组活动规划与目标展开;6.解决工期、工序管理上的问题;7.改进职能部门的工作;8.其他。第三节 关联图应用关联图的步骤:1.确定要分析的“问题”。“问题”宜用简洁的“主语 谓语”的短语表示,一般用粗线方框 圈起。一个粗方框只圈一个“问题”,多个问题则应用多个方框圈起来。“问题”识别规则是“箭头只进不出”。2.召开诸葛亮会。与会者应用“头脑风暴法”就分析的“问题”充分发表意见,找“因素”(手段)。3.边记录,边绘制,反复修改关联图。4.用箭头表示原因与结果(目的与手段)的关系;箭头指向是:原因 结果。5.原因要深入细致地分析,直至找出末端原因。末端原因应是可以直接采取对策的原因,其识别标志是:箭头只出不进。第三节 关联图应用注意事项:1.用因果分析关联图时,“要因”必是由对其末端原因逐一经现场验证并作出“标识”;2.图中一定有若干相互关联的因素。实例产品的焊缝质量不良进行原因分析外观质量差气孔构件表面处理不净温度控制不好焊接材料不当坡口尺寸不合要求焊丝材质不对焊接预热温度低后热保温不严谨层温未在较高温度断续未融合焊速不当时