-
分析coffee break python中相似网页聚合优化的效
资源介绍
5.2实验评价指标
(1)相似网页聚合准确率
相似网页聚合准确率是指在每个网页簇中,与网页簇特征一致的网页占网页
簇中网页总数的比率。
SW=n/N
其中:n为与网页簇特征一致的网页数量,N为网页簇中网页的总数,SW
为相似网页聚合准确率。SW越大,聚合效果越好。
(2)相似网页聚合召回率
相似网页聚合召回率是指每个网页族中,与网页簇特征一致的网页数量占全
部网页中该类型网页数量的比率。
RW=n/N
其中:n为与网页簇特征一致的网页数量,N为全部网页中该类型网页数量,
RW为相似网页聚合召回率。RW越大,聚合效果越好。
(3)广告匹配准确率
广告匹配准确率是指针对用户的每个兴趣特征,与该特征准确匹配的广告数
量占与该特征匹配的所有广告数量的比率。
SA=n/N
其中 n为与该特征准确匹配的广告数量,N为全部广告中该类型广告的数量,
RA为广告匹配的召回率。RA越大,说明广告匹配精度越高。
5.3实验结果分析
(1)相似网页聚合优化效果分析
本次试验首先对试验数据中的上网日志进行预处理,提取出日志中的、和三
个关键字段,并识别出上网账号为“13125154”的用户,然后对该用户行为特征
进行独立分析。其中跟踪窗口的大小设置为 400,行为标准设置为 3%。
分别将优化前后的相似网页聚合方法运用到用户行为特征分析过程中,然后
分别对跟踪窗口中的网页进行分析。之后在两种分析结果中分别选择出特征为旅
游、租房、股票、汽车、、英语培训和皮肤过敏的网页簇,最后对这些特征最后
形成了特征为汽车的网页簇,该簇共包括 34个网页,其中汽车类网页 19张;
而通过优化后的相似网页聚合方法,最终形成的汽车网页簇共包括 32个网页,
- 上一篇: Opencv+Visual Studio2017环境配置检测代码
- 下一篇: cifar10(图片版)