-
论文研究运用深度学习技术,针对MRI数据实现自动识别阿尔茨海默病的多种技术接口探究
资源介绍
5.2 管理多介质
在处理大量数据时,为了满足高效率和合理的费用,应用在数据仓库中的基本技术应该
能够解决多种存储介质的问题。仅仅在 D A S D上管理一个成熟的数据仓库是不够的。考虑到访
问速度和存储费用,对数据的存储要分层次。层次的区分如下:
主存 —非常快 —非常贵
扩展内存 —非常快 —贵
高速缓存 —非常快 —贵
D A S D —快 —适中
光盘 —不慢 —不贵
缩微胶片 —慢 —便宜
由于数据仓库中的大量数量和被访问到的可能性这两方面因素存在,一个满载的数据仓
库应该放在多种存储层次上。处理数据仓库技术应该能管理多种存储介质上的数据。
5.3 索引/监视数据
数据仓库的灵魂就在于灵活性和对数据的不可预测的访问。这一点也就是要求能够对数
据进行快速和方便的访问。数据仓库中的数据如果不能方便和有效地检索,那么建立数据仓
库这项工作就不是成功的。当然,设计者可以利用许多方法来使数据尽可能地灵活,例如利
用双重粒度级和数据分割。但这些技术一定要支持方便的索引,一些索引技术常常是有用的,
如二级索引、稀疏索引、动态索引、临时索引等等。而且,建立和应用索引的费用不能太高。
相同地,数据仓库中的数据也应能随意地被监视。监视数据的费用也不能太高,过程不
能太复杂,监视程序在需要时应能随时运行。
有很多理由要监视数据仓库中的数据,包括:
■ 决定是否应数据重组。
■ 决定索引是否建立得不恰当。
■ 决定是否有太多数据溢出。
■ 决定数据的统计成份。
■ 决定剩余的可用空间。
如果数据仓库技术不支持对数据的方便和高效地监视的话,那么它就不适用。
5.4 多种技术的接口
数据仓库另一个非常重要的问题是要能够用各种不同的技术获得和传送数据。如果在向
第5章 数据仓库和技术 97
下载