-
中文版tinyxml指南的发现结
资源介绍
8.13 发现结果
8.3.6 评估
我们已经对模型的第一次运行了评估。 没有发现任何规则。 没有什么再需要评估的了,
对吧? 那么让我们切换回设计透视视图,看一下我们在前面的步骤中简要提到的参数。 有
两个主要系数用于表示是否要将频繁模式转化为关联规则,即 置信度和支持度。 置信度用
于衡量我们有多大的信心在一个属性被标记为 true 时,关联属性也被标记为 true。
在典型的购物篮分析示例中,我们可以看一下糕点和牛奶这两个常常彼此关联的项目。
如果我们查看十个购物篮并发现四个购物篮中购买了糕点,七个购物篮中购买了牛奶,并且
在购买糕点的四个购物篮中,有三个也购买了牛奶,则我们对以下关联规则有 75% 的信心:
糕点 → 牛奶。 其计算方式是用同时购买糕点和牛奶的例项数 3 除以这两项可能会同时发
生的例项数 4(3/4 = 0.75 或 75%)。 规则糕点 → 牛奶”有机会发生四次,但仅发生了三
次,因此我们对此规则的信心不是绝对的。
现在请想一想该规则的逆规则: 糕点 → 牛奶。 在十个假设的购物篮中,七个中发现
了牛奶,四个中发现了糕点。 我们知道同时购买这两种产品的购物篮数(或这两种产品之
间的关联频度)为三次。 因此我们对牛奶 → 糕点”的信心仅为 43%(3/7 =0.429 或 43%)。
牛奶被发现和糕点一起购买的机会为七次,但只发现了三次,因此我们对“牛奶→ 糕点”
的信心远低于对“糕点 → 牛奶”的信心。 如果某人到商店购买糕点,则我们对于他还将
购买牛奶的信心高于相反的情况。 这一概念在关联规则挖掘中称为“前提 → 结论”。 前
提有时也称为前件,而结论有时也称为结果。 对于每一对属性,置信度都会因哪个属性为
- 上一篇: 88个经典Android应用程序打包下载-源代码.zip
- 下一篇: QT调用百度离线地图