登录 注册
当前位置:主页 > 资源下载 > 14 > 研究Web文本挖掘技术

研究Web文本挖掘技术

  • 更新:2024-09-19 23:17:14
  • 大小:247KB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:网络安全 - 安全技术
  • 格式:PDF

资源介绍

作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术, Web挖掘正悄然兴起, 倍受关注. 目前, Web挖掘的研究正处于发展阶段, 尚无统一的结论,需要国内外学者在理论上开展更多的讨论. 同时,Web挖掘系统的开发对其研究也将起到很大推进作用. 首先探讨了Web挖掘的有关理论, 从Web挖掘的定义、Web挖掘与Web信息检索的关系、Web挖掘任务的分类与功能等方面加以阐述. 然后重点分析了Web文本挖掘的方法, 包括: 文本的特征表示、文本分类与文本聚类. 在此基础上简单介绍了一个Web文本挖掘系统原型WebMiner. WebMiner 采用了多agent 体系结构, 将多维文本分析与文本挖掘这两种技术有机地结合起来, 以帮助用户快速、有效地挖掘Web上的HTML文档.