-
设计精确时间度量处理的事实表:撰写科学论文以获得引用和提案以获取资助的指南
资源介绍
图 5.5 处理精确时间度量的事实表设计
同时,与日期维表不同,大多数情况下很少会有对分秒的描述。.
如果企业内有明确时间片定义的属性,比如轮班时间,广告时间等,那么可
以将这些属性定义为对午夜时点的偏移量。如果粒度到分钟,那么这些每日时间
的维度会造成 1440 条记录,如果粒度到秒会产生 86400 条记录。这时候也用得
到以前描述的 SQL 日期时间戳的设计。
6.6 大维度
数据仓库中最有意思的维度是一些非常大的维度,比如客户,产品等等。一
个大的企业客户维度往往有上百万记录,每条记录又有上百个字段。而大的个人
客户维度则会超过千万条记录,这些个人客户维度有时也会有十多个字段,但大
多数时候比较少见的维度也只有不多的几个属性。
真正大的维度总是由多个数据源衍生的。大的企业中,客户可以来自于几个
账户管理系统。比如,银行中客户可以来自于抵押,信用卡,支票和储蓄等多个
业务部门。如果银行想要创建一个所有部门的客户维表,那么就需要对这些各自
独立的客户列表进行剔重,规范化并且合并。步骤如图 5.6 所示。