
网络爬虫
课程笔记
青岛City
该知道的都知道了,不知道的慢慢了解~
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
jsoup库简单查询笔记
jsoup库学习笔记一、输入1.1 从字符串中分析文档1.2 解析一个body片段1.3 从URL加载一个Document1.4 从一个文件加载一个文档 jsoup用来解析html文档 一、输入 1.1 从字符串中分析文档 使用静态方法,或者如果页面来自 Web,并且您希望获取绝对 URL。 parse(String html, String baseUri) 该方法能将输入的HTML解析为一个新的文档。参数baseUrl用来将相对URL转化为绝对URL,并指定从那个网站获取文档。 1.2 解析一个bod原创 2020-11-11 20:20:19 · 299 阅读 · 0 评论 -
解析网易的新闻内容(基于jsoup库)
实验一 解析网易的新闻内容(jsoup) 一、 实验目的 了解网络爬虫 练习jsoup库的使用 二、 实验内容 利用jsoup库模拟浏览器获取并处理网页中的html元素标签。 2.1 了解网络爬虫与jsoup库 jsoup的中文官方手册:https://www.open-open.com/jsoup/ 了解connnect方法的使用: 2.2 查看网页结构 2.3 模拟浏览器请求获取数据 Document document = Jsoup.connect(“http://dy.163.com/a原创 2020-11-09 10:31:46 · 631 阅读 · 3 评论