登录 注册
当前位置:主页 > 资源下载 > 35 > 指南 [中文]:在tinyxml中过滤不一致的数据

指南 [中文]:在tinyxml中过滤不一致的数据

  • 更新:2024-05-22 12:20:38
  • 大小:6.46MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:算法与数据结构 - 大数据
  • 格式:PDF

资源介绍

图 7.12 设置过滤条件 第四步:过滤不一致数据  在 Twitter 数据列中,有一个为“99”的不匹配数据,我们打算要把它替换为“N”,这 里我们调用“Replace”操作符,在设置参数里面,我们选择“single”单一属性,atttibute 属性选择“Twitter”,“replace what”选择“99”,replace by 填为“N”。参见图 7.13。  图 7.13 过滤不一致的数据 第五步:数据采样约简  在数据挖掘过程中,有时候数据集的数据内容太多,我们想取一半的数据进行模型的训 练,我们使用“Sample”采样操作符,在参数设置中我们选择“relative”相对成比例的采样