-
基于Python开发的10000网页搜索引擎课程设计
资源介绍
10000网页简单上手,代码和配置环境全部写好,傻瓜式操作。
执行文件顺序是
1.Spider.py进行爬取网页并分析
2.index.py生成倒排索引,idf文件
3.app.py运行搜索引擎
4.在默认浏览器输入 http://localhost:8080/ 进行检索
若要使用数据库
1.writeDB.py写倒排索引与idf(时间较长)
2.可以在summary.py切换from DB_search import s使用数据库
注意:
还需要停用词是stopwords.txt
- 上一篇: Python入门指南2.5
- 下一篇: 图像处理大作业 使用python实现简易PS