-
如何应对噪声数据问题-浙江大学针对大数据的讲解
资源介绍
如何处理噪声数据
分箱(binning):
首先排序数据,并将他们分到等深的箱中
然后可以按箱的平均值平滑、按箱中值平滑、按箱的边界平滑等等
聚类:
监测并且去除孤立点
计算机和人工检查结合
计算机检测可疑数据,然后对它们进行人工判断
回归
通过让数据适应回归函数来平滑数据
- 上一篇: 数据仓库的应用-浙大关于大数据的讲解
- 下一篇: 噪声数据-浙大关于大数据的讲解