资源介绍
ECE 143团队11:业务分析仪表板
团队成员:
詹姆斯·朗(James Long),约翰·巴比特(John Babbitt),克里斯汀·林德(Christine Lind),狄龙·希克斯(Dillon Hicks),尼罗什·潘迪
用法和使用的模块:
除标有*的模块外,以下所有模块均可使用conda安装。
报废:
为了刮擦福布斯数据集的描述,请确保您有一个包含福布斯数据集的文件夹和一个将写入刮擦的数据集的空文件夹。 然后,提供相对于脚本的这两个文件夹的路径,并使用以下参数运行python文件:
python scraping . py - - in_path “ input path ” - - out_path “ output path ”
#Dependencies
pandas
wikipedia *
tqdm
向量化:
为了运行矢量化并向主数据集添加要素,请确保已