-
如何处理缺失值-浙江大学关于大数据的讲解
资源介绍
如何处理空缺值
忽略元组:当类标号缺少时通常这么做(假定挖掘任务设计分类或描述),当每个属性缺少值的百分比变化很大时,它的效果非常差。
人工填写空缺值:工作量大,可行性低
使用一个全局变量填充空缺值:比如使用unknown或-∞
使用属性的平均值填充空缺值
使用与给定元组属同一类的所有样本的平均值
使用最可能的值填充空缺值:使用像Bayesian公式或判定树这样的基于推断的方法
- 上一篇: 数据预处理的形式-浙大关于大数据的讲解
- 下一篇: 数据仓库的应用-浙大关于大数据的讲解