-
运用深度学习技术从MRI数据中自动识别阿尔茨海默病的快照研究 - 数据仓库中的论文
资源介绍
3.6 数据仓库中的快照
数据仓库是应各种各样的应用和用户而建,如顾客系统,市场系统,销售系统和质量控
制系统。不管数据仓库有什么非常不同的应用和类型,还是有一条共同的线索贯穿其中。在
其内部,每个数据仓库都围绕着一个称之为“快照”的一种数据结构。
图3 - 3 4说明了数据仓库快照的基本组成形式。
快照是因为一些事件的发生而产生
的。能够触发快照的事件有很多种。
一类事件是对离散活动的信息的记录,
例如填写支票,打电话,收到货物,
完成订单,购买保险单等。在发生离
散活动时,将会带来一些商业活动,
并且需要记录下来。总之,离散活动
是随机发生的。
触发快照的另一类常见的事件是规定的时间点。在一个特定的时刻,快照就会触发。典
型的时间点包括日末,周末,月末。当然,这些时间点是事先可预测的,并不是随机的。
由事件触发的快照有四个基本部分:
• 键码( K E Y )。
• 时间单元。
• 只和键码相关联的初始数据。
• 作为快照过程的一部分所捕获的二次数据,和初始数据或键码无直接的关系。
在数据仓库的这些基本部分中,只有二次数据是可选的。
键码可以是唯一的也可以不唯一。键码可以是单一的数据元素。但在数据仓库中,更多的
键码是由用来识别初始数据的很多数据元素组成的混合物。键码用来识别记录和初始数据。
时间单元根据时间元素生成,例如年、月、日、时和刻。时间单元通常是 (但并不总是 )指
快照所描述事件已经发生的时刻。有时时间单元指的是捕获数据的时刻。 (在一些情况下,事
件发生时刻和捕获信息的时刻是不同的,而在另一些情况下是没有差别的。 )在由固定时间触
发事件的情况下,时间元素可以暗含而不是直接附于快照中。
初始数据是与记录的键码直接相关的非键码数据。例如,假设键码表示产品销售,时间
元素描述的是销售活动终结的时刻,初始数据描述的是销售什么产品以及销售的价格、条件、
地点和代理。
二次数据,如果存在的话,表示快照生成时捕获的外来信息。如与销售相关的二次数据是
一些关于产品出售的附带的信息 (例如成交时的股市价格 )。关于销售的另一个二次信息是销售
时银行对优惠顾客的流行利率。有很多种伴随信息可以加到数据仓库记录中去,如果将来这
第3章 设计数据仓库 65
下载
时间
键码 非键码初始数据 二次数据
图3-34 数据仓库中的数据记录是一个时刻的快照,
包括不同类型的数据