-
如何撰写被引用的科学论文和获得资助的提案:缓慢变化维写作技巧
资源介绍
6.12 缓慢变化维
流程检查
规划与设计:需求/现状 -> 架构 -> 实现 -> 测试/发布
数据流:抽取 -> 清洗 -> 规格化 -> 提交
当数据仓库被告知一条已经存在的维度纪录在某些方面发生了变化,会生成
3 种基本响应。我们称这 3 种响应为装载类型 1、2 和 3 的缓慢变化维。
6.13 类型 1 缓慢变化维(覆盖)
第一种类型 SCD 是对于已经存在的维度纪录一个或多个属性的复写。见图
5.14,当数据被校正而不需要保留历史纪录,或不需要执行以前的报表,可以选
择第一种处理方式。
图 5.14 处理类型 1SCD
第一种方式的复写是潜在数据的一种更新,在 ETL 环境中,这种从早期不变
的集结表的复写必须向前传递,以至于这些表被用于产生最终装载表,这种复写
是受保护的。这个问题将在第八章阐述。
尽管向第一种缓慢变化维度插入新纪录需要依赖新的维度键值的生成。类型
1 的处理变化不会影响维度表键值或事实表键值,对数据的影响是这三种装载类
型中最小的。如果聚合是直接建立在变化的属性上的,装载类型 1 对聚合事实表
有一些影响。在第 6 章将详细描述这些影响。
一些 ETL 工具包含更新和插入功能。这些功能对于开发者很方便,但大大降
低了性能。为了提高性能,在 ETL 处理中要将更新现有数据的过程和插入新数据