-
选取实验数据 - coffee break python
资源介绍
5.1实验数据选取
本文所需的实验数据主要包括两部分,即用户上网日志和文本广告。其中用
户上网日志来自北京交通大学信息中心网络日志,且选择 4月 15日到 4月 24
日十天的网络日志作为实验数据。在这些大量的网络日志中,包含了“12125154”
这个上网账号在十天中产生的 400条上网记录。而在这条上网记录中,包含了
旅游、租房、股票、汽车、、英语培训、皮肤过敏等多个主题的网页,其中旅游
类网页 35张,集中分布在 23日和 24日这两天;租房类网页 30张,集中分布
在 21日、22日和 23日这三天;股票类网页 40张,均匀分布在十天中;英语