
JSoup
文章平均质量分 82
Java爬虫
Cyril_KI
LLM、图神经网络、社交网络挖掘、负荷预测、联邦学习
展开
-
Android利用PdfRenderer解析并展示Jsoup获取的PDF文件
PdfRenderer将Jsoup爬取的PDF文件转为Bitmap,然后利用ImageView展示。原创 2021-02-20 21:04:05 · 47102 阅读 · 1 评论 -
JSoup解析原网页获取Form Data和Query String Parameters
爬取过程中需要多次模拟查询,以获得后续操作需要的Form Data和Query String Parameters。原创 2021-02-05 11:36:03 · 53172 阅读 · 0 评论 -
JSoup模拟登录新版正方教务系统(内网-教务系统)获取信息过程详解
利用JSoup模拟登录校园内网和新版正方教务系统,然后爬取成绩和课表等信息,并展示在APP上。原创 2020-10-24 12:03:17 · 92744 阅读 · 3 评论 -
Java爬虫简单判断是否模拟登录成功(以JSoup为例)
简单来说就是找到登录成功or失败这两个界面的不同之处,进而做出判断。原创 2020-09-07 09:22:19 · 81893 阅读 · 0 评论 -
(已解决)JSoup提交表单数据后没有返回需要查询的数据(返回了原网页)
传入的url不正确(并不是网页上方的url),缺少了Query String Parameters中的一些参数,比如doType=query。原创 2020-09-01 19:12:17 · 93763 阅读 · 0 评论 -
爬虫时怎么查看需要提交哪些表单数据?
以爬取教务系统成绩为例,说明需要提交哪些数据。原创 2020-08-29 22:11:54 · 93225 阅读 · 0 评论 -
JSoup携带cookies连续跳转登录多个界面
项目需求:先模拟登录了某一个网站,接着携带其cookies进入到另一个网站的登录界面,登录成功之后携带其cookies又进入到另一个界面。原创 2020-08-22 22:16:51 · 92430 阅读 · 0 评论 -
JSoup利用获得的cookies访问该网页中的其它链接
利用JSoup模拟登录了校园内网,而校园内网中又有很多链接,譬如知网以及教务系统等等。本文要做的就是利用登录内网拿到的cookies去访问这些链接。原创 2020-08-22 21:16:39 · 93019 阅读 · 0 评论 -
JSoup模拟登录网站(以校园内网为例)
JSoup模拟登录网站的详细过程,以华北电力大学内网为例。原创 2020-08-22 19:08:40 · 93703 阅读 · 4 评论 -
Exception in thread “main“ org.jsoup.HttpStatusException: HTTP error fetching URL. Status=422, URL=
Form Data中的authenticity_token是动态变化的。原创 2020-08-22 18:24:01 · 92987 阅读 · 6 评论 -
Java爬虫:Jsoup利用dom方法遍历Document对象
Java爬虫基础:Jsoup利用dom方法遍历Document对象。原创 2020-08-18 12:33:48 · 90132 阅读 · 0 评论