-
如何撰写被引用的科学论文和获得资助的项目提案-生存支持元数据
资源介绍
图 4.12 生存支持元数据
对于去重复过程成功的把分离的源实体联合成为一个单一的实体(如客户实
体)的情况,如果这些源实体在各自的源系统中已经指定了主键,则需要有一
个表对这些过时的主键进行维护,以提高对源系统数据进行去重复处理的速度。
提交
提交是 ETL 最后的重要步骤。在此步骤中,已经清洗并规范化过的数据被实
际写入到维结构*最终用户和应用系统访问。在只由一个表空间组成供最终用
户访问的最小经数据仓库中,维表只是简单地写入这个表空间。但对于大型的数
据仓库,从含有多个表空间到更广泛的分布式数据集市自治网络,维表必须以一
致的方式仔细地发布。提交非常重要,我们将在第 5 章和第 6 章中详述。
5.7 小结
回顾以上细节,本章主要覆盖了四个大的主题:目标、技巧、元数据和度量。
数据清洗和规范化的目标在于减少数据中的错误,提高数据的质量和可用