《大数据时代ppt.ppt》由会员分享,可在线阅读,更多相关《大数据时代ppt.ppt(21页珍藏版)》请在第壹文秘上搜索。
1、 浅析大数据时代大数据时代下的变革最近几年,大数据这个词突然变得很火,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,同时在我国国务院和其他国家的政府报告中多次提及,无疑成为当今互联网世界中的新宠儿。我对大数据一直好奇已久,阅读了很多资料仍不得其解,直到读完大数据时代才有了粗略的认识。大数据时代下的变革大数据时代是由英国作者维克托麦尔舍恩伯格等所著,由盛杨燕和周涛翻译。作者是研究大数据这方面的大师,译者也翻译得很有水平。本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革,这些变革涉及到我们生活的方方面面,几乎其影响程度可以与两次工业革命相媲美。作者在第一部分提出了三个比较令人震惊的观
2、点,第一,不是随机样本,而是所有数据,这里要求数据要更多。第二,不是精确性,而是混杂性,这里要求数据更杂。第三,不是因果关系,而是相关关系,这里要求数据要更好。第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力。第三部分则是阐述了大数据时代下的弊端以及在管理上的措施。个人认为本书的精髓部分是第一部分,第一部分的三个观点涉及的面很广,包括统计学、逻辑学、哲学等。后两个部分都是以第一部分这三个观点为基础展开阐述的。大数据时代观点我侧重于从第一部分中的这三个观点谈谈自己的看法,这三个观点可以说是哲学上说的世界观,因为世界观决定方法论,
3、所以这三个观点对传统看法的颠覆,就会导致各种变革的发生。首先是第一个,作者认为在抽样研究时期,由于研究条件的欠缺,只能以少量的数据获取最大的信息,而在大数据时代,我们可以获得海量的数据,抽样自然就失去它的意义了。放弃了随机分析法这种捷径,采用所有的数据。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义,列举了日本“相扑”等来证明使用全体数据的重要性。这个观点足以引起统计学乃至社会文明的变革,因为统计抽样和几何学定理、万有引力一样被看做文明得以建立牢固的基石。我对这个观点还是比较认同的,如果真能收集到整体的数据而且分析数据的工具也足够先进,自然是全体数据研究得出的结果更令人信服
4、。但是这个观点也过于绝对,就算是在大数据时代要想收集到全体数据还是不太可能实现的,因为收集全体数据要付出的代价有时会很大。比如说,你要检测食品中致癌物质是否超标,你不可能每一件食品你都检测一遍吧。大数据时代观点第二,要效率不要绝对的精确。作者说,执迷于精确性是信息缺乏时代和模拟时代的产物,只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法被利用。作者是基于数据不可能百分之百正确的考虑而做出这样的判断的,如果采用小数据一个数据的错误就会导致结果的误差很大,但是如果数据足够多、数据足够杂那得出的结果就越靠近正确答案。大数据时代要求我们重新审视精确性的优劣,
5、甚至还说到大数据不仅让我们不再期待精确性,也让我们无法实现精确性。谷歌翻译的成功很好地证明了这一点,谷歌的翻译系统不像Candide那样精确地翻译每一句话,它谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制,和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。大数据时代观点第三个观点,不是因果性,而是相关性,这是这本书中争议最大的一个观点,不仅是读者,就算是本书的译者也在序言中明确地说到他不认同“相关关系比因果关系更重要”的观点。作者觉得相关关系对于预测一些事情已经足够了,不用花大力气去研究他们的因果关系。作者用林登的亚马逊推荐系统的成功,
6、证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的代表,从啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于他们策略的帮助。一句话,知道是什么就够了,不用知道为什么。很明显作者所举的例子都是属于商业领域的,但是对于其他领域来说这个观点就值得商榷了。比如说,在科学研究领域,你需要知其然也需要知道其所以然,找到事件发生的原理。用文中的一个例子说明,乔布斯测出整个基因图谱来治疗癌症,但是你治疗癌症你必须知道癌症发病的原理,知道哪一段基因导致了这种疾病,不可能只是说收集各种数据,然后利用其相关性来判断哪里出现了问题。大数据时
7、代下的变革作者在书中把大数据说的很厉害,在最后一部分分析大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据过度依赖所带来的后果。也用少数派的报告这部电影来说明如果痴迷于数据会导致我们将生活在一个没有独立选择和自由意志的社会,如果一切变为现实,我们将被禁锢在大数据的可能性之中。所以书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。毫无疑问,大数据将会给社会管理带来巨大的变革。精彩句子赏析 第一部分:第1句:世界的本质就是数据。(P) 感悟及喜欢的原因:现今的我们正处于一个时代转型中,有谁会想到富士、柯达胶卷这样
8、的百年企业会被时代所淘汰,因为科技的发展与互联网的日益强大,数据将逐步取代旧事物,创造出新事物。 第2句:这是当今社会所独有的一种新型能力:以一种前所未有的方式,通过对海量数据进行分析,获得巨大价值的产品和服务,或深刻的洞见。(P4) 感悟及喜欢的原因:数据可以反映出很多项指标,特别是海量数据的处理下,如何挖掘获得价值更是需要一种具有新型的复合能力人才,而得以用数据改变对世界的认知、改变市场、改变关系。 精彩句子赏析 第3句:大数据的核心就是预测。(P16) 感悟及喜欢的原因:以前单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代,运用大数据的处理与分析,为我们的生活创造出前所未有的可量化
9、的维度。 第4句:大数据是指不用随机分析法这样的捷径,而采用所有数据的方法。(P39) 感悟及喜欢的原因:“总体=样本”以前是做不到的,现在对于数据的储存、处理能力、统计技术与数据资源等各方面都有了飞速的发展,信息总量的变化也导致量变到质变的飞跃,并在其中去捕捉随机抽样所无法揭示的细节。 精彩句子赏析 第5句:要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。(P60) 感悟及喜欢的原因:处理海量数据会不可避免地导致部分信息的缺失,错误并不是大数据固有的特性,而是一个亟需我们去处理的现实问题。目前,我们正经历着从数据的精准性到总体即样本的关注焦点转变,分析其多样式与相
10、关关系是这种缺陷的弥补方法。 第6句:局限于狭隘的小数据中,我们可以自豪于对精确性的追求,但是就算我们可以分析得到细节中的细节,也依然会错过事物的全貌。(P66) 感悟及喜欢的原因:寻找数据间的关联并利用,才是大数据超过小数据时代的真正价值。 精彩句子赏析 第7句:大数据的相关关系分析法更准确、更快、而且不易受偏见的影响。建立在相关关系分析法基础上的预测是大数据的核心。(P75) 感悟及喜欢的原因:只用知道是什么,不用知道为什么,相关关系帮助我们更快、更好地了解了这个世界。 第8句:数据化是指一种把现象转变为可制表分析的量化形式的过程。数字化指的是把模拟数据转换成用0和1表示的二进制码。(P1
11、04) 感悟及喜欢的原因:计量和记录一起促成了数据的诞生,它们是数据化最早的根基。数字化带来了数据化,但是数字化无法取代数据化,因为数字化是把模拟数据变成计算机可读、可处理的数据,和数据化有本质上的不同。 精彩句子赏析 第9句:预测给我们知识,而知识赋予我们智慧和洞见。(P117) 感悟及喜欢的原因:虽然数据的使用还远未成熟,但是从潜在的数据中挖掘出巨大的价值,然后揭示出新的深刻洞见,是我们思维方式的发展,同时也是智慧的开启。 第10句:“现实挖掘”这里指的是通过处理大量来自手机的数据,发现和预测人类行为。(P118) 感悟及喜欢的原因:麻省理工学院媒体实验室通过分析每个人去了哪里、见了谁,成
12、功地区分出了感染了流感的人群,而且在感染者还完全不知道自己已经患病之前就做出了区分。比如,伊格尔通过研究关注家庭主妇平均每周去几次洗衣店,来试图回答疾病如何传播和城市如何繁荣。再比如Twitter通过创新,让人们能轻易记录以及分享他们零散的想法从而使情绪数据化得以实现。这种种都说明,通过读取、分析数据,我们可以找出很多相关关系,让我们对世界、对生活有更深刻的理解。 精彩句子赏析 第11句:将世界看作信息,看作可以理解的数据的海洋,为我们提供了一个从未有过的审视现实的视角。它是一种可以渗透到所有生活领域的世界观。(P126) 感悟及喜欢的原因:随着时代的发展,数据逐渐可以量化一切。数据的价值也从
13、最基本的用途转变为未来的潜在用途。另外数据不同于物质性的东西,它的价值不会随着它的使用而减少,而是可以不断地被处理、再利用,挖掘出更大的未来价值。 第12句:数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”。而数据的折旧值、数据废气和开放数据则是更为独特的方式。(P135)感悟及喜欢的原因:通过数据处理、创新再利用来发挥出现实价值,如搜索关键词、推荐引擎、预测住宅的价值、设计店面的最佳布局、判断营销活动的有效性等等,从战争中学习战争,从数据中学习数据。精彩句子赏析 第13句:他们思考的只有可能,而不考虑所谓的可行。(P166) 感悟及喜欢的原因:内行与外行最
14、大的区别在于思维不受限,它让思维方式有更好的延展性、多样性与丰富性。 第14句:一旦得以有效利用,大数据就可以变革公司的赢利模式和传统交流方式。(P170) 感悟及喜欢的原因:大数据的利用,可以重新定位生产商与供应商的关系;可以通过商品本身收集数据并传回制造商进行研究与开发;可以通过用户交互提高服务;当文字变成数据,不仅人可以用之阅读,机器也可用之分析充分说明,第一,个人也好,公司也好,都需要与时俱进;第二,大数据的多样性有待于更全面的开发,更好地服务于人们的生活。精彩句子赏析 第15句:大数据公司的多样性表明了数据价值的转移。(P176) 感悟及喜欢的原因:随着数据价值转移到数据拥有者手上,
15、传统的商业模式同时也被颠覆了。数据不仅能够优化生活和服务,甚至还能催生新的行业,催生新时代的人才。 第16句:行业专家和技术专家的光芒都会因为统计学家和数据分析家的出现而变暗,因为后者不受旧观念的影响,能够聆听数据发出的声音。(P180) 感悟及喜欢的原因:学会聆听数据发出的声音,第一需要与时俱进,跟上时代进步的步伐。第二改变了我们怎样看待知识的价值。第三了解到,如今不只是专业技能的深度很重要,大数据的广度也变得很重要。 精彩句子赏析 第17句:卓越的才华并不依赖于数据。(P212) 感悟及喜欢的原因:大数据的风险是数据主宰一切的隐忧,但是个人的直觉、对市场的敏锐度等独特个体所展现出来的才华同
16、样重要,它所呈现出来的强有力的创造力不亚于大数据。 第18句:变革并不止于规范。(P219) 感悟及喜欢的原因:大数据的运作是在一个超出我们正常理解的范围之上的。大数据需要被监测并保持透明度,加上使这两项得以实现的新型专业技术和机构。我们要发展,就必须先有其规模,在规模中去寻找规范的操作手法,才能让变革立于不败之地。 第19句:莎士比亚曾写道:“凡是过去,皆为序曲。”(P244) 感悟及喜欢的原因:过去的每一点每一滴是为明天的开始打下坚实的基础,一贯如是地坚持下去才有效力。 精彩句子赏析 第20句:大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。(P247) 感悟及喜欢的原因:大数据是一种资源,也是一种工具,这里引用一句话“混乱构成了世界的本质,也构成了人脑的本质,而无论是世界的混乱还是人脑的混乱,学会接受和应用它们才能得益。” 读后感 这本书解释了我们正处于大规模生产、分享和应用数据的时代,告诉我们如何科学的应用大数据,开启新的思维模式,新的生活方式与新的工作形态,以应对正在发生着的利益与风险。 大数据开启了一次重大的时代转型。 以样本=总