-
运用深度学习技术从MRI数据中自动识别阿尔茨海默病的若干反馈循环策略-论文研究
资源介绍
4.5 一些反馈循环技巧
我们可以用以下的一些技巧来使反馈循环成为一个和谐的循环:
■ 用很小而很快的步伐建立数据仓库最初的几个部分,仔细聆听最终用户的意见。随时
准备做快速的调整。
■ 如果可以使用原型工具的话应用原型法,并使用从原型中收集的观察结果而使反馈循
环起作用。
■ 看看别人是怎样确定他们的粒度级别,学习一下他们的经验。
■ 与一个对整个过程了解的有经验的用户一起进行反馈的处理。不论什么时候都让你的
用户在暗中作为反馈循环的动力。
■ 看看本机构现在有什么系统正在运转。
■ 进行J A D会议并模拟其输出以得到想要的反馈。
有好多方法用来提高数据的粒度,如以下所列:
■ 当源数据置入数据仓库时,对它进行汇总。
■ 当源数据置入数据仓库时,对它求平均或进行计算。
■ 把最大/最小的设定值置入数据仓库。
■ 只把显然需要的数据置入数据仓库。
■ 用条件逻辑选取记录的一个子集置入数据仓库。
对于数据怎样轻度汇总是没有限制的(限制只存在于设计者的脑海里)。
有一点很重要,在典型的需求系统的开发中,在还不清楚大部分需求之前就忙于进行是
不明智的。但在数据仓库的建造中,如果已知了至少一半的需求后,还不开始同样也是不明
智的。换句话说,在建造数据仓库中,如果开发者想等着大多数需求明了后才开始工作,那
么这个仓库是永远建不起来的。尽快启动与 D S S分析员的反馈循环是非常重要的。
4.6 粒度的级别—以银行环境为例
以如图4 - 5所示的一个银行或金融环境的简单数据结构为例。
在左边(在操作级上)是操作型数据。在这里我们可以看到银行业务的详细数据。六十天的
活动数据都存储在操作型的联机环境中。
操作型数据的右边是轻度汇总级的数据,总共是十年的活动记录。对于给定帐户,特定
月份的活动记录存储在数据仓库的轻度汇总部分。由于记录很多,所以这部分比原记录更加
简洁。在轻度汇总数据级有更少的 D A S D数和更少的行。
当然,也有真实档案级的数据,其中存储着每一个细节的记录。真实档案级的数据存储
在适合于大量数据管理的媒体上。请注意并不是数据的所有字段都传送到真实档案级中去,
只有那些由于有合法的理由、信息性理由等所需要的域才被存储。那些即使在档案模式中以
后有用的数据在传送到真实档案级时也会从系统中清除出去。
真实档案级数据可以存储在如磁带机这样一种单一的媒体上。磁带机作为存储介质非常
便宜,但作为访问介质是非常昂贵的。然而,我们可以将有可能需要访问的一小部分的真实
档案级数据联机存储,这是完全可能的。例如,一个银行可以将最近 3 0天的业务记录联机存
储。最近3 0天的数据是真实档案数据,而它们仍旧是联机的。 3 0天结束后,这些数据被送到
磁带机上,腾出的空间就可以存放下一个 3 0天的真实档案数据。
90 数 据 仓 库
下载