-
如何撰写能被引用的科学论文和获得资助的项目提案,是中将重点关注的内容
资源介绍
的可能性!如果数据不能支持业务目标,这个时候就要发现。在第四章中将更多
的探讨数据评估。
4. 接收数据线和业务规则的遍历。一旦源数据完成数据评估步骤的质量保证
并且理解了最终的目标数据模型,数据仓库架构工程师和业务分析师必须和 ETL
架构工程师及开发者一起完成为抽取,转换和加载的数据仓库的主题域的整个数
据线和业务规则,并且最好他们理解这些规则。完全的理解这些数据线和业务规
则是几乎不可能的,因为那样 ETL 小组必须遇到所有的数据实际问题,但这一步
骤的目标是提交尽可能多的知识给 ETL 小组。数据评估步骤必须创建 ETL 特有的
业务规则的两个子类:
4a. 在数据清洗步骤中需要进行改造的数据;
4b. 对分离的数据源的维度实体和可度量的数字事实强制一致性来获得标准
的结构;
5. 充分理解数据仓库数据模型。ETL 小组必须充分理解数据仓库的物理数据
模型。这种理解包括维度模型的概念,仅仅理解基本的表到表之间的映射是不够
的,开发小组必须对如何使维度,事实及其他维度模型中的特定表一起发挥作用
来实施一个成功的 ETL 解决方案有好的理解。切记 ETL 系统的主要目标是用最有
效的方式将数据送给最终用户工具。
6. 验证计算和公式的有效性。与最终用户一起校验任何在数据链中任何指定
的计算。这个规则来源于纽约市建筑行业的谚语“测两次,切一次”。正如你不
想得到一座用错误尺寸的材料造成的摩天大楼,你同样不希望在数据仓库中部署
不正确的度量指标。在 ETL 过程中花时间以错误的法法编码之前,确保你的计算
公式都是正确的将是非常有用的。