登陆注册
3765300000029

第29章 Database System(8)

Data Warehousing

Data warehouses contain consolidated data from many sources?? spanning long time periods?? and augmented with summary information. Warehouses are much larger than other kinds of databases; sizes ranging from several gigabytes to terabytes are common. Typical workloads involve ad hoc?? fairly complex queries?? and fast response time is important. These characteristics differentiate warehouse applications from OLTP applications?? and different DBMS design and implementation techniques must be used to achieve satisfactory results. Adistributed DBMS with good scalability and high availability ??achieved by storing tables redundantly at more than one site?? is required for very large warehouses.

An organization's daily operations access and modify operational databases. Data from these operational databases and other external sources ??e. g.?? customer profiles supplied by external consultants?? are extracted by using gateways?? or standard external interfaces supported by the underlying DBMS. Standards such as Open Database Connectivity ??ODBC?? from Microsoft are emerging for gateways;ODBC is an application program interface that allows client programs to generate SQL statements to be executed at a sewer.

There are many challenges in creating and maintaining a large data warehouse. A goad database schema must be designed to hold an integrated collection of data copied from diverse sources. For example?? a company warehouse might include the Inventory and Personnel departments' databases?? together with Sales databases maintained by offices in different countries. Since the source databases are often created and maintained by different groups?? there are a number of semantic mismatches across these databases?? such as different currency units?? different names for the same attribute?? and differences in how tables are normalized or structured;these differences must be reconciled when data is brought into the warehouse. After the warehouse schema is designed?? the warehouse must be populated?? and over time?? it must be kept consistent with the primary data sources.

Data extracted from operational databases and external sources is first cleaned to minimize errors and fin in missing information when possible?? and transformed to reconcile semantic mismatches. Transforming data is typically accomplished by defining a relational view over the tables in the data sources ??the operational databases and other external sources??. Loading data consists of materializing such views and storing them in the warehouse. Unlike a standard view in a relational DBMS?? therefore?? the view is stored in a database ??the warehouse?? that is different from the database ??s?? containing the tables it is defined over.

The cleaned and transformed data is finally loaded into the warehouse?? Additional preprocessing such as sorting and generation of summary information is carried out at this stage. Data is partitioned and indexes are built for efficiency. The large volume of data to be loaded means that loading is a slow process; loading a terabyte of data sequentially can take weeks. Parallelism is therefore important for loading warehouses.

同类推荐
  • 听BBC学英语:英语10倍速增长学习法

    听BBC学英语:英语10倍速增长学习法

    本书内容丰富,讲解详细,书中每一篇热点新闻都配有BBC 原声音频,发音清晰流畅且现场感强,方便学习者利用闲暇时间随时随地学习,从而迅速提高听力水平。读者们在练习听力的同时还可以模仿原汁原味的语音语调,训练自己的发音,提高口语表达能力。学习地道英语,看这本就够了。
  • 百年钟声:香港沉思录

    百年钟声:香港沉思录

    回归祖国十六年,香港发生了怎样的变化?祖国对香港的发展给予了多少支持和影响?香港同胞的民心回归、对祖国的认同感如何?香港给内地带来了怎样的启迪与反思?作者着力书写了回归后的现实情状,其中包括:解放军驻港部队面临的各种考验和优异表现,香港各路精英的成长之路及对港贡献,香港的慈善事业,香港的民生、医疗、文化、媒体、教育,香港的廉政建设,香港所面临的挑战与前景等。作者真实书写了回归后香港的现状。其中一些章节,不仅是当今香港成功经验的写照,而且对内地乃至许多国家地区的发展有着借鉴意义,其中最为突出的是香港的廉政建设。
  • 冬日里的莲花:双语(泰戈尔经典诗选Ⅲ)

    冬日里的莲花:双语(泰戈尔经典诗选Ⅲ)

    《冬日里的莲花:泰戈尔经典诗选3(双语彩绘典藏版)》是双语诗歌系列中的一本,收录了泰戈尔的《采果集》和《流萤集》。诗句有的情感喷薄欲出,有的语言清新意味隽永,有的将抒情和哲思完美结合,给人以无尽美感和启迪。
  • 计算机英语

    计算机英语

    本书共九章,包括:计算机的发展及总体介绍,计算机硬件,计算机操作系统,数据库系统,软件工程,计算机网络和因特网,办公自动化系统,多媒体技术以及计算机安全。每个章节都配有正文的参考译文,帮助读者更加方便地学习和理解。每章的后面配有练习题并附参考答案,以利于对本单元内容进行巩固。课后的附录包含了单词表,词组表,计算机英语语法及科技英语写作要点,全方位地给读者提供丰富的相关知识。
  • 商务英语900句“袋”着走

    商务英语900句“袋”着走

    本书提炼出外企员工日常交流中使用最高频的话题情景,力求生活化,真实化。全书点面结合,通过句型替换,举一反三,以一句顶万句,方便记忆。 本书采用口袋书设计,方便携带,可谓挤地铁乘公交的上选佳品。便于随时随地学习,为自己充电。上班前看一眼,一天都能用得到。
热门推荐
  • 这个世界爱着我

    这个世界爱着我

    静静的许多经历对所有同龄人,尤其是高职院校的同学来说,都是一个很好的借鉴,我作为邢静静所在学校的老师,很愿意为广大青年读者推荐这部书。同时,我作为一名教育工作者——当然,也是一位家长,认为这本书也十分适合广大教师和家长群体阅读。因为,我们从这位年轻女孩的人生经历中,也会得到思考和启示,那就是:我们该如何做到懂孩子,爱孩子,成就孩子。
  • 诡墓笔录

    诡墓笔录

    时代更迭,去腐立新,曾以盗墓为生的吴家,本欲抽身而退,洗心革面。却不料卷入神秘组织阴谋之中,更有境外团伙参与其中。不得已之下,吴家三代人走上了寻墓探险之路。地下宝藏埋葬千年,国之瑰宝,华夏文明之见证,怎可落入宵小与他国贼人之手?吴家挣扎自己命运的同时,亦想终结这场阴谋。一座座神秘的墓中,诡异的阴兵,骇人的粽子,恐怖的妖魔与传说,它们到底在守护着什么?那些人又在寻找着什么?
  • 三界最强反派

    三界最强反派

    他,天生经脉被封,灵魂被锁,成长于嘲笑中,生活于欺凌中。一次偶然的雷击令他重获新生,脑海中诡异出现的灵诀,犹如彗星般迅速崛起。天才?不好意思我就是。背景?我就是自己最强大的靠山。战天骄!灭仇敌!碎苍穹!破山河!只为探寻身世,守护心中想要守护的那个人!
  • 小可爱微微甜

    小可爱微微甜

    甜宠爽文【意外救了一只小狼狗,小狼狗要以身相许怎么办?在线等,挺急的!】意外救了一只小狼狗,小狼狗表示要以身相许,从此同吃同住一起上学,可是画风却变成了……‘苏啾啾,本少爷饿了,快去给本少爷做吃的。’‘???’‘苏啾啾,没有我的允许不许离开我半步,不许看别的男人,不许靠近别的男人半步,快去给我写作业!’苏啾啾怒摔:“说好的以身相许了?”怎么就变成他的保姆兼跟班了???
  • 兽医罗布

    兽医罗布

    “我们是兽医罗布的老婆!”我望着眼前这两个女人,两个为兽医罗布生过小孩的女人,封闭的记忆开始苏醒过来。从现在倒数过去,大概有十六个年头了吧。“日子像风一样刮得轻盈!”我不自禁地这样感叹。兽医罗布和他的两个女人、遥远的县城都被我早已弃置在了脑后。已是踏上中年末梢的这两个女人,让很多画面在我脑海里闪现出来。从结了一层冰的窗玻璃边沿往外望,雪花依然纷飞,天地一片灰蒙。县委大院和宿舍披着厚厚的白衣。
  • 无敌护娃狂魔

    无敌护娃狂魔

    “粑粑,他们抢我吃的。”“杀了。”“粑粑,这妖兽看起来很好吃,要不我们吃了吧。”“这是神兽……吃了吧。”作为一名吃货的奶爸,沈青很头疼。
  • 从瓦罗兰到超神学院

    从瓦罗兰到超神学院

    这是一个关于瓦罗兰和超神学院的故事。(简介暂定,临时更改,多多包涵~)
  • 元始战记smg

    元始战记smg

    如果真的有神,如果真的是神创造人类,如果神要人类毁灭,你我应该顺从?还是与神宣战?生存与毁灭,不过一瞬…对与错,你我要如何抉择?存与不存间,极武殿是沉是浮?圣与魔间,不许命要怎样开出花朵?侍神与叛神间,是命运安排或是自我抉择?这里有无数故事也只是一个故事,没有人可以是永恒的主角,也没有人会永远落寞…
  • 竹马翻译官II

    竹马翻译官II

    从小深爱女主却隐藏自己的感情。重逢时,抱着时,亲吻时,原本以为这一辈子都不可能在这样跟她亲密的感情时,才发现,原来放弃她,他比谁都还要舍不得。似乎从一开始就已经注定,那个叫苏微恙的女子,是上帝赐给他的天敌。她的记忆是在五岁那年开始变得美丽的,其实命运待她不薄,五岁的时候就认识他,七岁的时候懂得什么是情。在分离的时候,她对他只说了一句话:“我总是赢,只输过你。”青梅竹马的感情因为两个家庭忽然的变故在他们之间划下一道不可逾越的冰峰。三年后的再次重逢,命运两个不懂爱的人绑在一起。婚后的相处让她又期盼又害怕。面对冷漠的他,她该何去何从?
  • FBI心理暗示学

    FBI心理暗示学

    了解人心——通过一个人的神情举止、穿着打扮、语言习惯、签名笔迹等,学得超强阅人术,见微知著,慧眼侦知事件的真相,瞬间读懂。攻克人心——通过一些心理学策略和技巧,如从众心理、贝勃定律、登门槛效应等,熟知人性,攻克他人心理堡垒!获得人心——通过一些人际交往方法和处世技巧,如期望定律、互惠原理、自己人效应等,驭人有术,聚心有方,成就自己!