-
如何撰写被引用的科学论文和获得资助的提案:逻辑数据内在映射
资源介绍
4.2 逻辑数据映射内部
在深入你将遇到的不同的数据源细节之前,我们需要研究逻辑数据映射文档
的实际设计。该文档包括整个企业针对数据仓库源系统的数据定义,目标数据仓
库数据模型,以及从原有格式到最终目的转换所需要的完全数据操作。
逻辑数据映射的组成
逻辑数据映射(见图 3.1)通常用一个表或者电子表格格式来表示,它包括
以下特定的组成部分:
目标表名称:数据仓库中出现的物理表名称;目标列名称:数据仓库表
中的列名称;
表类型:表示这个表是事实表,维表或者子维表(支节)
SCD(缓慢变化维)类型:对维表,这个部分表示是类型 1,类型 2 或者
类型 3 的缓慢变化维。这个指标对维表中的不同的列可以是不同的。
比如在客户维中,名字可能属于类型 2(保留历史信息),而姓可能属于
类型 1(覆盖)。这些 SCD 类型将在第五章展开详细探讨。
源数据库:源数据所在的数据库实例的名称。这里通常是指连接数据库
所需的连接字符串。如果出现在文件系统中,它也可以是一个文件的名
称。这时,还需要包含这个文件的路径。
源表名称:源数据所在的源表的名称。很多时候需要多个表。这时,只
需将生成目标数据仓库相关表的所有表简单列出即可。
源列名称:生成目标所需的相关列。简单的列出装载目标列需要的所有
列。源列之间的关联在转换部分记录。
转换:源数据与期望的目标格式对应所需的详细操作。这个部分通常用
SQL 或者伪代码来编写。
逻辑数据映射中的列有时是组合的。比如,源数据库,表名称和列名称可能
被组合在一个源列中。这个组合列的信息可能用原点来分隔信息,如
ORDERS.STATUS.STATUS_CODE。如果不考虑格式,这个逻辑数据映射文档的内容