Jsoup对象
2021-04-12 01:28
标签:数据 com ring 字符串 file document text 解析 lis parse():解析HTML和XML,返回Documet对象 重载方法 timeoutMillis超时时间 获取的路径就是对应的HTML文档,这个HTML文档只不过是在浏览器上被解析成用户看到的界面。真实的数据还是代码 常用于HTML爬虫程序 例如比价网:慢慢买 主要用来获取Element对象(document继承了node的下的element对象,能获取任意的Element对象) 上面的倒数三个方法) getElementById?(String id):根据id属性值,获取唯一的element对象 getElementsByTag?(String tagName):根据标签名称,获取元素对象集合 getElementsByAttribute?(String key):根据属性名称,获取元素对象集合 getElementsByAttributeValue?(String key, String value):根据属性名称和属性值,获取元素对象集合 是Documet和Element的父类 Jsoup对象 标签:数据 com ring 字符串 file document text 解析 lis 原文地址:https://www.cnblogs.com/rijiyuelei/p/12404973.html1.Jsoup:工具类,解析HTML,XML文档,加载文档进内存,获取dom树-->返回Document文档对象
2. Documet:文档对象=内存中DOM树
3.Elements:元素Element对象的集合。可以当做:泛型为Element的ArrayList集合
4.Element:元素对象。获取元素的名称、属性、文本
5.Node:节点对象。是上面所有的爹