-
中文版tinyxml操作指南步骤
资源介绍
13.5 获取数据
本章使用生物医学期刊网站进行演练: http://www.ncbi.nlm.nih.gov/pubmed/
13.6 操作步骤
第一步:检索地址
登录该网站后,在检索栏输入“dkk1”检索蛋白质信息,将地址
http://www.ncbi.nlm.nih.gov/pubmed/?term=dkk1
复制后,调用“Get Page”操作符,该操作符通过输入地址,向网络发送请求,将网页上所
包含的文本信息取到。
第二步:爬取信息
选择网页每一页显示 200 条搜索记录,且网页显示格式改为 XML 格式,调用获取信息操作
符“Extract Information”,其功能是从文档中获取有规则的信息,我们需要用它来获取记录
条数,在参数设置中我们选择“String Matching”字符串匹配,匹配规则我们的设置我们需
要查看源代码,并检索记录数,如图 13.1
- 上一篇: Android开发详解.pdf
- 下一篇: [Android开发从入门到精通].扫描版.pdf