-
如何撰写被引用的论文和获得资助的提案 - 点击流数据集市装载调度
资源介绍
图 9.3 点击流数据集市装载调度
装载进度
依赖的批处理 一般一个批处理会嵌套包含好几层的批处理任务,来并行
执行多个任务或维持任务与任务之间的完整性。例如,一个装载数据集
市维度的批处理必须在执行事实表任务之前装载成功。记住,数据仓库
并不完全依赖参照完整性。通过从属的批处理是在数据仓库中实施参照
完整性的一个办法。
频度 数据仓库中的数据导入频度有:每月,每周,每日或连续装载。这
一部分的元数据就是定义批处理的执行频率的。
执行进度 如果一个任务是每日执行,那么元数据的属性就会捕获到每次
批处理执行的时间。如果是每月执行,那么在元数据中会纪录处理执行
的那个具体日期。批处理必须具备在任何预定时间预定计划下执行任务
的能力。
恢复步骤 当处理失败的时候,需要有一个恢复的动作。恢复有可能是一
个很长时间的处理,经常在另一份独立的文件中提出。进行恢复处理要
让负责 ETL 批处理的小组了解进程。
数据质量错误事件元数据