-
StreamDFP是一个通用的流挖掘框架,用于通过自适应处理概念漂移以实现磁盘故障预测
资源介绍
StreamDFP
StreamDFP是用于通过概念漂移自适应进行磁盘故障预测的通用流挖掘框架。 它包括特征提取,样本标记以及预测模型的训练。
StreamDFP旨在基于三种关键技术来支持各种学习算法:在线标记,概念漂移感知训练和一般预测。
我们分两部分实现StreamDFP的原型。 第一部分在Python中实现以进行预处理。 我们实现了特征提取,缓冲,标记和第一阶段下采样。 第二部分是用Java编写的。 我们从本地文件系统中读取处理后的数据,以进行第二阶段的下采样和培训。 我们基于实现增量算法和变化检测器。
在StreamDFP-2.0.0中,我们将在线传输学习合并到StreamDFP中以预测少数磁盘模型。
先决条件
Python3:请安装和 。
Java:jdk-1.8.0
数据集
我们在公共数据集使用以下四个磁盘模型:
希捷ST3000DM001
希捷ST4000DM0