登录 注册
当前位置:主页 > 资源下载 > 50 > Python网络爬虫ScienceDirectWebCrawler:在Matlab中实现从ScienceDirect数据库下载和分析数据的爬虫代码

Python网络爬虫ScienceDirectWebCrawler:在Matlab中实现从ScienceDirect数据库下载和分析数据的爬虫代码

  • 更新:2024-07-28 16:56:50
  • 大小:2.06MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:Matlab - 大数据
  • 格式:ZIP

资源介绍

爬虫代码matlab 使用 Python 调查 ScienceDirect 数据库 这个代码文件夹是由张子涵为他在纽约大学牙科学院的实验室实习而制作的。 目的是使用网络爬虫从数据库中获取信息。 这些代码主要基于 Python,并涉及一些 Matlab 和 SQL。 heatmap_create 部分用于生成不同关键字组合的总找到结果的可视化表示。 download_pdf 部分用于下载与此关键字组合相关的所有 pdf 并将它们存储到不同的文件夹中。 database_create部分用于提取每篇文章相关的重要信息,包括相关关键词、DOI、作者、发表日期等,并存入MySQL数据库。 analysis_pdf 部分用于将 pdf 文件转换为可编辑和可搜索的 JSON 文件,以便用户可以跟踪特定关键字并浏览内容。 请注意,每个文件夹中的代码或多或少彼此相似。 这是为了方便读者将它们视为单独的项目以供将来参考。 我还发布了数据提取团队的临时演示文稿,以更好地介绍我在创伤项目中的角色和贡献。 可以在 中找到最终组织良好的程序。