-
如何使用tinyxml进行属性过滤以及数据类型转换的指南[中文版]
资源介绍
图 8.8 检查数据
检查数据缺失值、异常值情况,约简数据集中的属性数量,将 Select Attributes 操作符
添加到流中,并选择包含以下属性: Family、Hobbies、Social_Club、Political、Professional、
Religious、Support_Group。
关于某人是否为各种社区组织的成员且内容为 yes/no 的属性被记录为 0 或 1,并被
导入为“integer”数据类型。 RapidMiner 中使用的关联规则操作符需要属性为“binominal”
数据类型,需要使用 Numerical to Binominal 操作符修改相关列的类型为 binominal。
图 8.9 过滤属性以及转换数据类型
8.3.5 建模
在流程中加入 FP-Growth 的操作符,FP-Growth 中的 FP 表示频繁模式 (Frequency
Pattern),如图 8.10。 频繁模式分析对于许多种数据挖掘而言都可以非常方便地进行,并且
是关联规则挖掘的必要组成部分。 如果不知道属性组合的频率,就无法确定数据中的任何
模式是否发生得频繁到足以被视为规则。
- 上一篇: 相关系数矩阵-tinyxml指南[中文]
- 下一篇: 北京市政务大数据平台顶层设计框架及应用方案