-
十万微博数据集.rar下载
资源介绍
爬取的103个微博用户截止2019年8月发布的所有原创微博,以csv文件存储,每个用户对应一个csv文件。包括48位女性,55位男性,男女性分开存储。包括id、微博正文、微博原始图片URL、原始视频URL、发布日期、发布工具、点赞数、评论数、转发数、话题和@用户。总共包括十多万条微博,可以用做性别分类等自然语言处理任务的数据集。
- 上一篇: 新浪微博数据集sql文件-标记了话题
- 下一篇: 用于文本挖掘的新浪微博数据.doc