-
指南 [中文]:在tinyxml中过滤不一致的数据
资源介绍
图 7.12 设置过滤条件
第四步:过滤不一致数据
在 Twitter 数据列中,有一个为“99”的不匹配数据,我们打算要把它替换为“N”,这
里我们调用“Replace”操作符,在设置参数里面,我们选择“single”单一属性,atttibute
属性选择“Twitter”,“replace what”选择“99”,replace by 填为“N”。参见图 7.13。
图 7.13 过滤不一致的数据
第五步:数据采样约简
在数据挖掘过程中,有时候数据集的数据内容太多,我们想取一半的数据进行模型的训
练,我们使用“Sample”采样操作符,在参数设置中我们选择“relative”相对成比例的采样
- 上一篇: 绘制频率分布直方图-tinyxml指南[中文]
- 下一篇: 属性约简-tinyxml指南[中文]