《SAS 数据仓库方法论.docx》由会员分享,可在线阅读,更多相关《SAS 数据仓库方法论.docx(5页珍藏版)》请在第壹文秘上搜索。
1、SAS数据仓库方法论目* II快一垄际方法论浏览o1,K么是一邦仓库O2.龙史数据仓库侑北齐现金O3.龙一仓一的技术募由O4,敷一仓库的一术将在o5,K-与雷图/饵仓库的目标o6.关悚成方国亲 B.SAS独立秋线生在方法花的胡巧o】业务夔动o2.收集需求的一Oo3.快速应用开发(RA1.O C.方法论的框栗A.快速童率方法论浏览一个企业在开发和实施敛播仓扉时,傥用一个音效和经验证的方兴论是关键婚.达一点巳是十分清笑的T.专座到这一点,多年未SAS研比.开展和我麦丁经验在利实施敷据仓库的方法论.我们件之为伐金成库方法论.本文件的这一节科福城达午方法论.1 .什么是蒙冬仓、?一个敛据仓库通*是一个
2、分嵌的敷据存储,在冀中信息是存为达4的一种形式,它适合于史务智健化和决策支持皋徙.据可能是以不冏形式有枕的,它并不影南O1.ni系蜕的运作.依据仓库的建立是用一林循环的i?步克善的过也而不是一步完善切.概括仓库通常是与解决企土不断致受的组织凡题的个过程有关.数据仓库通常是图绕主更凄立的.主Jg就是企业界兴JS的论题.比方你门、活动和爆作结果.敦据仓库的站构是由效据仓岸应淌足的应用决定的.快速报次信息是成功矣疑数据仓库的关钝.由于这一点,花引入T象鼓粕集市和信息臬市这处楂急.我寻呆市是敷籍仓库的一个孑集,它通常史力噬括.以满足对关心敷搭的查询有比我据仓库本身更快的速度。稿息集市存储可用生亩引hi
3、wcr)显示的Bi处理的信息.在信息集市中*包去以下儿荚信息;报告输出(打印的文本.观形等)多媒体介质(录京和录&内容的记录电子盘用2 .电文效福仓寿的史寿爱由效据仓肆为管理者和业务用户提供其正决立支琼的基础.企业为这些业务用户存储了多年的信息,但是数据仓库渔供方为他们设计的甫狗架的信息.数捉仓库实侑的最初阶段姓往娶饵决现成依义务同题(即较为枝动的),而以后总实电博是更为主动的.知据仓库的一个我In是它支持对数蠢的限时需委的查询和进行未方案典数据板术的需,就是说,数据仓库给史齐用户以不同方法分析数据的前:力和自由度.而不受我先设定的一俎系告的眼用。3 .建立效,舍库的技术理由就立数据仓*最共同
4、的技术理由是企生现用的信息技术错构不能清惫地请足业务寄晏.11去.信息技术集中于楚作票施.它保证业务过程运行所必须的任务的自动化.但是.运作桌统一敷不能气好地满足决里支持的需要.一个运作盛筑典型的有多小事务代龙kmnsacion)的应用构戊,年个应用使用门的一个过程和功能自出化.在运件票统中,争小亭多”争一分台的:k%细节郡记乘在与事务二闭美既做效据率中.事务系统的设计要才虑移部门运作翦要的组节信息有效地进入密使。有效性的要求导Ik应用开发者实更高度希市的数据和在存档发生之前就处筑决定作用应用的一周的有多少量据可存储.屋蚣小作累使对日常业各活的支药是非惇有效的.但他力对于运用常规的软件技术文材
5、报来制作.决俺加行政信息系猊并不是最好的.他们的信步点是在欺邦的有戕.米夕健供访同数据和轿数据文为有用决枭僖息协工JU系统和数非包库是完全不同的.内咨是不同的,恰的是不同的.硬件和软件的寄求是不同的.管理是不同的和用户是不同的.新据仓.*的存储是设计存能提供决策支持信息的.它由业务应用致据来构求,但数据要先经过提JR.再世行4逑.核检并追织列反映,需要的主题中去.数髡仓库的敷露是控这一粒时同的收集,并用于比较./分分析和赖利的.若用运作箴发存储的敷据袋决策支衿.将会45到以下的一年画建:决策要求计历史魏邦进行比九“桥和tfi测.这线付息通常在运件果筑中是无法律到的. 数据义为从运作敷露存区中提
6、取.Rt看时何推移,it些摄取也Jf长和犷大.敷舞的可率性.有效性和通用性都是无法咬定的,因为创立各种分析帝美的戛本叶巳生成了原始数揖源的多个复本和多个不Pi水平的数据子集. 在运作系施中的敷据是按一小转殊的肯动而格式化的.它并不考虑单垃决J1.的有要.从多个运作票掘唐中祖到的效据需要提案和处理,这使存假率顾及单 效据仓序的敷据不是多文的.这。味着不同人员对同一信息的需求樗费雪相同的普H.这也。味着在您分析的过程中敷禁不会改交。敷非仓库的数据装板是适时如可用于反测的。 数格仓库反映企业机枸蛆织的需要.敷据仓摩的物件是直接反映磨们单位的主题.这些主JQ规大得可谓是企业的需要而不*运作系统的要求.
7、 敏据仓*是整合的.所有义务索加的有价值营门都要蔓合到数据仓房的主Ji中去.多个业务数据与傲据的差异应该在襄优到象身仓库之前进行砂词. 数据仓库提供企业的历史回忆.多年的数据常以汇总的方式加以存储.与此片黑的.典理卸业务鹿用只存储一个较短时段的敢舞.,数据仓库片JE询劝能是优化的.优化戏暂看要对数据授汇总,授索引和油取子集.将敏并分隔和组合为详多可健的处合(分片和切块)的能力和有效地反复查询大量数据的能力是数据仓落的根本妾求. 最后.票据仓库必须与分析工具项小龙.蒙爽和维护微IS仓摩只是过程约一局部.一个ItIS仓库只有具备了辅助的决策支特工具时才是克善的,这一决策文村工具应反膜和利用据仓库的
8、结杓.5 .,认业务要和敷*仓库的目标如同巳短看到的,使用数据仓辱技术有清楚的技术理由.但是.清晰地设定数靠仓库矍实况的务If要和用以许价敏据仓序成功的标*这两音词#是十分It要的.在大息箱情形.蒙烟仓号是力业务S:门戛立的.所以票据仓客的战功依貌于对业务然门霭求的了那.由于这一点,由义务部门砖定故饵仓库的内容是必翁的.SAS快速珑库方法论也提供问卷和过程.它常胎令业*定数据仓库内杼和构架,它也书助金曳他:讦价准则和清基地累走数据仓库工程。清是地明白企业的密登和目标也将存助酰阴数据仓总工程与企业的关系以及数据库的作用和全史成功的关第.6 .关成功因素除了对金史的业务需求和败指仑用目的有一个清味
9、的了婚外,迁畲要采取以下步骤地保数据仓岸工程满足这些需妄和目标:选绛公甸可使的最育人员负费效据仓&工程.他对工程战功负有全JR.S1.ati括业务决倒者和H专家的号部门工程81.金据仓库成功的一个关键是业务专家和Ii专家的冷机合作.它将保证数据仓库工程的各个方面募权网及列.荻罩工程庆功所需要的密二投皆的承诺.工参榭有权的一致意见,工坦评价标发的一致。见.碣保业舞第门与IT毋门一或地为工程或功遗存努力.选锋可以提供撤据仓库克票解决方案的可*郛力能力依伙伴.#实Jit一个企业的发据仓库.它读在充成第一循环或工程的模块后,让单位的共佬成员如也其成功.若这一循环正确地实现T,M让方关的*个人具清,地。
10、到.因为它是可见的且直接关系到企史的目标.日到列等企业任务和处理的清单并从新马定其代先程度,再逢#犷展数据仓存的下一个工农,8. SAS快速竞立数据仓库方法论的细节故据仓库J1.立的过收一直还是比较新的,还缺少实践统验,并不为IT业界广泛了解.此外,欲据仓库常是这样跑一个工程.它与单位的许多部门交叉.要求M条的方案.交流和管理,在奠些情况下,最好汲取其它方面的经验井W徜一个合般,挣验证的方法论.至此,SAS研究所开发的SAS快遑建片方法论帮助企业开发一个高旭贵,据仓库,它可以在预算的苞围内按时地满足甚至州社用户的需要和期1.它提供一个检验收择仓库开发和实睫是否成功的测试锂栗.它是荽子SAS研究
11、所的咨询专家、合作伙伴和用户的量正碉实戏和经验我刎,比些专家成功地实施了数据仓库.这一方法论提供了经炎证的建库根案.包括过程.问卷.工作表华和模板.若企业自己开发这些.将是耗时交班于管理的。运用SAS的怏速建库方浊论.在实注数据仓本的往复Ii环的各阶段会快连地送交结果.使得在一个很坦的时何段内到达一个可量化的结栗.方法轮是运用快邃应用开发和SAS鸟使原51技术的一个分杭式的我建.这是一个整合的,业务裹动的处理:备用户和门在实解的各阶段都力重要的输入,为报告和分析目的而逐步但快速弟长勉使用票据仓库,对比IT部门应当充准备,SAS来统提供的工具(例忸健化的冬户机/效劳马.多厂商构架告可以将勒至曳宾
12、现一个灵活和假风险的处理,知对于我非仓库对全史的潜在国金.过线的每一步的投入(过程烫通、开发大吴和工作人员等)是#常任的.ItitSAS快过赛库方法论成功的三个主要因素是:也务成用户的关注;胡文的收集用户需求和工桎界定的研讨会;使用快M应用开发RAD)於理.这拴特点在下一节讨出.1.业务动SS快速遂生的方法论是一个高层地以业务为巫动的it程: 了解欲IE仓隹的需要和将从效福仓库中获注的业务管理/必复参加. 义务用户都是工卷嵬的成员.使用有用科优术收集.成立丈必和改善关于工荏今加者求的信息. 度it二程业务将三的信息应在工桎的早期阶段就加以收集。 复点是放在W佑由做据仓库存到的义务欢挽和投费回很
13、.2 .收集求的研讨会研讨会空象目标.范IS如优先这锌一经工嶷的高水平要素.这曾是堂娶的,齿为效好仓库工程爰影响许多不同总史分领城,这些箱城会有不同的优先程度。研计今也可以巾也完成工程所需要出时间,西方它使人们聚集在一爱,可遇少个别交设收臬惇息的反复次数。3 .快速应用开发(RAD)一个RAD循环是对SAS快速她左方法论本质的一个写现,因为需委尽快第。失他霜势力的结果.怏速应用开发基于反复开R的循环.即将一个大工程分为小工桂.成“构件.在牝等个物件效劳于单个操作单元或功位区域的信息密曼,毋个构件是一个功能的可管理的单元.是易于理解和可以快或向企业显示价值的.运用RAD可以使工程开发熄为企业用户
14、设定工程的优先,为每个构件设定主U以及为*个子工程清楚地划定范B1.总部任务完成后,会提出和羽磷进一步的臂宏.Ie环式的代理有如下的好处: 有利于应用檐护. 改良适应布戒改史的葩力. A小无法管理工程卸风殓 及.早提供用户的反应。 及早提交用户的可度量的好於. 我交高总堂的鲫决方窠. 及早提供结果.C.方法论的根架SAS快员虎本的方法礼其空地分为耗若如下的6步.这些步列提供工作的曼辑分段和检检工程是否陇立在一个坚实的基础上.讦估、富求调交和总拮令也去取于珑认.理解和t三忆工程日苏加单位的目标.i5H匕也建和野彳阶段基于使用RAD手段设计.开发和配置我据仓库环境.以下的流展茁接候了方法诒各个阶段的一小总猊和泡些.SAS快速成耳方法论的各个阶段在以下各节楂丑.1 .评估阶段在谆台阶杭.对影响要求解决方案的用户的现有情况和条件进行了解.了解的目的是分析用户的同显和解决它的方法.芍依讦估要确认和澄清目标,确认为渔清目标所做的环究的任何需要,这一评估将导致赛说开始、矣迟或取消这牛工程.翕龙初始阶技工率组的成员和工程范围.作用和主要的找交结果.2 .