-
学习Python基础知识的一种方式是通过使用njit-course-scraper构建页面抓取器,从HTTP中提取课程数据
资源介绍
NJIT课程页面抓取器
为了使自己熟悉Python,我为NJIT的课程表编写了页面抓取工具。 到目前为止,其中两个已经启动并运行: history.py提取了2000年到2014年的历史数据scrape.py提取了活跃学期的所有课程数据。
在运行之前,请在终端中执行以下命令:
pip install --upgrade pip
pip install lxml
pip install requests
下面是用于存储历史数据和活动数据的表的架构。 您可以微调varchar的大小,但我只是将它们设置为255,以解决文本中存在大量空格的特殊情况。
CREATE TABLE courses (
id int ( 11 ) AUTO_INCREMENT,
number varchar ( 255 ),
name varchar ( 255 ),
sect varchar ( 25