登录 注册
当前位置:主页 > 资源下载 > 10 > 论文研究-基于MapReduce的序列模式挖掘算法.pdf下载

论文研究-基于MapReduce的序列模式挖掘算法.pdf下载

  • 更新:2024-09-27 20:46:38
  • 大小:1.06MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:数据挖掘 - 大数据
  • 格式:PDF

资源介绍

针对传统GSP算法需要多次扫描数据库、I/O开销巨大的缺点,提出了一种基于MapReduce编程框架的序列模式挖掘算法MR-GSP(GSP algorithm based on MapReduce)。MR-GSP算法将原序列数据库划分为多个子序列数据库并分发到多个Map节点,Map函数扫描存放在Map节点内存中的子序列数据库,产生局部序列模式,Reduce函数对所有局部序列模式合并,扫描原序列数据库,计算局部序列模式的支持度,得到最终的序列模式。相比于传统GSP算法,MR-GSP算法只需扫描两次原始数据库即可得到所有序列模式。实验结果表明,MR-GSP算法在对大数据集进行序列模式挖掘时,可充分利用云计算技术的优势,提高挖掘效率。