-
运用java-jsoup解析HTML页面以抓取所需信息(例如号段)
资源介绍
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。
jsoup 可以从包括字符串、URL 地址以及本地文件来加载 HTML 文档,并生成 Document 对象实例。
如:我们可以通过访问号段查询页面,获取到手机号段信息,并提取信息存储供自身的业务使用。
附件提供了详细的介绍,并通过http get请求方式抓取页面内容的java代码以及jsoup jar包。