登录 注册
当前位置:主页 > 资源下载 > 35 > 中文版tinyxml操作指南步骤

中文版tinyxml操作指南步骤

  • 更新:2024-05-22 12:08:08
  • 大小:6.46MB
  • 推荐:★★★★★
  • 来源:网友上传分享
  • 类别:算法与数据结构 - 大数据
  • 格式:PDF

资源介绍

13.5 获取数据 本章使用生物医学期刊网站进行演练: http://www.ncbi.nlm.nih.gov/pubmed/ 13.6 操作步骤 第一步:检索地址 登录该网站后,在检索栏输入“dkk1”检索蛋白质信息,将地址 http://www.ncbi.nlm.nih.gov/pubmed/?term=dkk1 复制后,调用“Get Page”操作符,该操作符通过输入地址,向网络发送请求,将网页上所 包含的文本信息取到。 第二步:爬取信息 选择网页每一页显示 200 条搜索记录,且网页显示格式改为 XML 格式,调用获取信息操作 符“Extract Information”,其功能是从文档中获取有规则的信息,我们需要用它来获取记录 条数,在参数设置中我们选择“String Matching”字符串匹配,匹配规则我们的设置我们需 要查看源代码,并检索记录数,如图 13.1