摘要
Jsoup是一款JavaHTML解析器。可以直接解析某个URL地址,HTML文本内容。
Jsoup主要功能
1、从一个URL,文件或字符串中解析HTML
2、使用DOM或CSS选择器来查找、取出数据
3、可操作HTML元素、属性、文本
输入
jsoup可以从包括字符串、URL地址以及本地文件来加载HTML文件,并生成Document对象实例。
1、Document对象(一个文档的对象模型):文档由多个Elements和TextNodes组成(以及其他辅助Nodess)
其继承结构:Document继承Node.TextNode继承Node
2、一个Element包含一个子节点集合,并拥有一个父Element。他们还提供了一个唯一的子元素过滤列表