-
撰写科学论文以获得引用和提案以获取资助的逻辑数据映射方法
资源介绍
4.3 创建逻辑数据映射
数据仓库的成功主要来源于这样的情形,所有的数据放在一个逻辑位置,使
用户可以执行交叉功能分析。在后台,ETL 小组无缝的整合和转换分散的无组织
的数据并使它看起来好像从一开始就在一起的一样。数据仓库成功的主要标准之
一是它存储的数据是干净的和一致的。统一的数据存储需要对每一个源系统有相
当深入地了解。对数据源中的数据甚至源系统本身理解的重要性常常在 ETL 的项
目规划阶段被忽略和低估。在源系统得到确认和分析之前完整的逻辑数据映射是
不存在的。源系统分析通常分为两个主要阶段:
数据发现阶段;
异常检测阶段;
数据发现阶段
一旦理解了目标需要做成什么样子后,就要确认和检查数据源了。部分或者
全部的源系统可能在数据建模期间发生很大变化,但并不需要过多地考虑这些。
通常,只有主要的源系统在数据建模期间被确认出来。要知道数据建模工程师的
主要目标是建立一个数据模型,这一点很重要。任何来自数据建模期间的逻辑数
据映射都只是一个副产品----一个起点。况且,数据建模工程师花大部分的时间
和最终用户在一起,所以在逻辑数据映射中定义的源系统可能不是真的初始的或
者优化的源—记录系统。这需要 ETL 小组更深入到数据的需求中,确定每一个需
要加载到数据仓库中的源系统、表和属性。为每一元素确定适当的源或者记录系