《数据分析基础入门课程.pptx》由会员分享,可在线阅读,更多相关《数据分析基础入门课程.pptx(33页珍藏版)》请在第壹文秘上搜索。
1、数据分析基础入门课程1数据分析是什么?2数据分析六部曲3常用指标和术语4经典案例分析课程目录PART数据分析是什么?01数据分析是什么?数据分析是指使用适当的“统计分析”方法来对收集来的大量数据进行分析,将它们加以汇总、理解并消化的过程,以求最大化地开发数据的功能,发挥数据的作用。为什么要做数据分析?数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结出研究对象的内在规律。1描述性数据分析2探索性数据分析3验证性数据分析1现状分析2原因分析3预测分析数据分析的常见类型及其作用PART数据分析六部曲02明确目的和思路先决条件、提供项目方向01数据收集数据库建立02数据处
2、理清洗、转化、提取、计算03数据分析数据统计、数据挖掘04数据展现图标、表格、文字05报告撰写架构清晰、明确za结论、提出建议06明确目的和思路梳理分析思路,并搭建分析框架,把分析目的分解成若干个不同的分析要点,即如何具体开展数据分析,需要从哪几个角度进行分析,采用哪些分析指标01数据收集一般数据来源于四种方式:数据库、第三方数据统计工具、专业的调研机构的统计年鉴或报告(如艾瑞资讯)、市场调查。02数据处理数据处理主要包括数据清洗、数据转化、数据提取、数据计算等处理方法,将各种原始数据加工成为项目需要的直观的可看数据。03数据分析常用的数据分析工具,掌握Excel的数据透视表,就能解决大多数的
3、问题。需要的话,可以再有针对性的学习SPSS、SAS等。数据挖掘是一种高级的数据分析方法,侧重解决四类数据分析问题:分类、聚类、关联和预测,重点在寻找模式与规律。04数据展现一般情况下,数据是通过表格和图形的方式来呈现的。常用的数据图表包括饼图、柱形图、条形图、折线图、气泡图、散点图、雷达图等。进一步加工整理变成我们需要的图形,如金字塔图、矩阵图、漏斗图、帕雷托图等。05常用图表类型和作用作用作用饼图饼图柱形图柱形图条形图条形图折线图折线图气泡图气泡图其他其他成分(整体的一部分)排序(数据的比较)时间序列(走势、趋势)频率分布(数据频次)相关性(数据的关系)多重数据的对比报告撰写一份好的数据分
4、析报告,首先需要有一个好的分析框架,并且图文并茂,层次明晰,能够让阅读者一目了然。报告需要有明确的结论、建议或解决方案。06PART常用指标和术语03常用指标和术语平均数绝对数与相对数百分比与百分点频数与频率比例与比率倍数与番数同比与环比PART经典案例分析041主线分析2分析思路3整体分析4分析方法经典电商销售数据模型分析3区域不同区域的销售数据1产品各种产品及产品属性的销售数据客户不同属性的客户的销售数据2主线分析4销售质量单额情况重点产品比率3发货情况客户数量发货次数1阶段整体数据阶段业绩达成率销售数据构成分析累计数据档期任务达成率同比完成情况2分析思路-数据分解1234销售额总体销售额
5、、销售量,与行业标准比较,从而分析得到业绩状况及判断业绩变换类型季节因素依据行业淡旺季规律,与销售数据中的销售额形成对比,分析淡旺季发展规律,可为生产运作做规划产品线通过总体产品结构分析,了解整体产品结构分布和重点产品表现价格体系通过整体价格结构分析,了解优势价位区间,提供价格结构调整的合理性建议分析思路-关键指标A销售数据分析通过销售额和销售量的增长分析,可以找出客户增长或下滑的本质;如果销售额增长大于销售量,说明增长主要来源于产品平均价格提高,它反应了市场平均价格的提高或者是客户产品结构上升,即结构性增长;反之则为容量性增长整体分析B季节性分析很多消费品/行业存在明显的季节性/周期性趋势;
6、通过分析时间数据即可为企业提出合理的生产运作及渠道供货规划C产品结构分析从产品结构可以分析主导产品和产品成长的合理性,及企业利润源和销售量是否对应,初步判断企业未来的产品规划和调整方向D价格体系分析从价格结构看产品分布合理性,也可以判断目前发展现状与战略发展方向是否一致E区域分布分析从销售区域分布看市场布局的合理性;区域布局和整体战略目标的一致性;明确下阶段企业区域布局的规划方向F销售异动分析通过对数据的分析,发现存在异动的产品或区域;并从中分析出异动发生的原因G区域-价格分析从区域内的产品动态来看区域内的产品组成变化,即区域的产品适应性,从而发现潜力产品、老话产品等H价格-区域分析从区域的价
7、格分布来看产品的提升空间,即不同区域的价格构成的合理性,从中分析市场提升的空间和方向分析方法此类项目特殊分析法:此类项目特殊分析法:三维数据分析法6个月纵向分析法区域分类分析法常用数据分析方法常用数据分析方法:聚类分析对应分析因子分析回归分析相关分析方差分析常用数据分析方法聚类分析(Cluster Analysis) 聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够
8、从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。因子分析(Factor Analysis) 因子分析是指研究从变量群中提取共性因子的统计技术。因子分析就是从大量的数据中寻找内在的联系,减少决策的困难 因子分析的方法约有10多种,如重心法、影像分析法,最大似然解、最小平方法、阿尔发抽因法、拉奥典型抽因法等等。这些方法本质上大都属近似方法,是以相关系数矩阵为基础的,所不同的是相关系数矩阵对角线上的值,采用不同的共同性2估值。在社会学研究中,因子分析常采用以主成分分析为基础的反覆法。常用数据分析方法相关分析(
9、Correlation Analysis) 相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度。相关关系是一种非确定性的关系,例如,以X和Y分别记一个人的身高和体重,或分别记每公顷施肥量与每公顷小麦产量,则X与Y显然有关系,而又没有确切到可由其中的一个去精确地决定另一个的程度,这就是相关关系。对应分析(Correspondence Analysis) 对应分析(Correspondence analysis)也称关联分析、R-Q型因子分析,通过分析由定性变量构成的交互汇总表来揭示变量间的联系。可以
10、揭示同一变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。对应分析的基本思想是将一个联列表的行和列中各元素的比例结构以点的形式在较低维的空间中表示出来。常用数据分析方法回归分析 研究一个随机变量Y对另一个(X)或一组(X1,X2,Xk)变量的相依关系的统计分析方法。回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。方差分析(ANOVA/Analysis of Variance) 又称“变异数分析”或“F检验”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状。造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量是对观测变量有显著影响的变量。COMPANYTHANKS!