- 博客(1)
- 资源 (1)
- 收藏
- 关注

原创 静态网页爬虫——2018/11/11
静 态 网 页 爬 虫——小说网站为例——环境:windows 7idea 2018.2jdk 1.8思路:获取带有章节链接的目录网页通过正则表达式,得到每一篇的a标签通过a标签拼接成每一篇文章的url调用Jw方法,再次获取每篇文章的正文通过正则表达式,得到标题和正文(正文由于正则表达式写的很差,后面用了字符串的拼接与替换)总结...
2018-11-11 00:32:35
221
关于#centos#的问题,如何解决?
2023-02-15
TA创建的收藏夹 TA关注的收藏夹
TA关注的人