
爬虫,java
皇马杀疯了
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
etree.tostring中文汉字显示乱码问题解决
用xpath做爬虫,初步etree.tostring整理网页框架,显示乱码,代码如下# -*- coding:UTF-8 -*-import requestsfrom lxml import etreeurl ='http://www.j342c.net/base.php?wer'raw_html = requests.get(url)ahtml = etree.HTML(raw_html.content)aresult = etree.tostring(ahtml)网页由gb180原创 2021-01-10 01:10:12 · 2942 阅读 · 0 评论 -
jsp转图片(jpeg)问题 改后缀名!
想做个爬虫,但爬取的网站有jsp生成的验证码,jsp如何生成的机制我不了解,而jsp下载下来是文本,而在html中显示,无法爬取让我一筹莫展,没办法切割分裂进行机器识别。后来我尝试改了后缀名,可行!外网java代码参考:http://boards.straightdope.com/sdmb/showthread.php?t=109081http://st原创 2017-04-16 21:21:21 · 1456 阅读 · 0 评论