-
Python网络爬虫ScienceDirectWebCrawler:在Matlab中实现从ScienceDirect数据库下载和分析数据的爬虫代码
资源介绍
爬虫代码matlab
使用
Python
调查
ScienceDirect
数据库
这个代码文件夹是由张子涵为他在纽约大学牙科学院的实验室实习而制作的。
目的是使用网络爬虫从数据库中获取信息。
这些代码主要基于
Python,并涉及一些
Matlab
和
SQL。
heatmap_create
部分用于生成不同关键字组合的总找到结果的可视化表示。
download_pdf
部分用于下载与此关键字组合相关的所有
pdf
并将它们存储到不同的文件夹中。
database_create部分用于提取每篇文章相关的重要信息,包括相关关键词、DOI、作者、发表日期等,并存入MySQL数据库。
analysis_pdf
部分用于将
pdf
文件转换为可编辑和可搜索的
JSON
文件,以便用户可以跟踪特定关键字并浏览内容。
请注意,每个文件夹中的代码或多或少彼此相似。
这是为了方便读者将它们视为单独的项目以供将来参考。
我还发布了数据提取团队的临时演示文稿,以更好地介绍我在创伤项目中的角色和贡献。
可以在
中找到最终组织良好的程序。
- 上一篇: 系统设计说明书-模板.docx
- 下一篇: 图书管理系统概要设计说明书