爬虫
文章平均质量分 94
jon胡
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
东方财富网新版A股数据爬取
最近东方财富网更新了网页布局,之前学习量化的时候东方财富网的爬虫失效,于是就重新研究了下。1.网页分析在东方财富网改版之前,股票代码数据直接存在网页源码里,获取非常方便。最近改版之后,数据以表格的形式存储在JS文件里。此前的爬虫版本:'''输入为html源码,输出为股票代码和名字。''''''此前股票代码和名字可从http://quote.eastmoney.com/stocklis...原创 2019-04-05 17:10:16 · 8731 阅读 · 5 评论 -
【python】获取百度搜索结果--URL\网站名称
需求:只需输入搜索关键词可设置搜索时间范围可翻页呈现搜索页每一条信息的标题、链接、网站名称、简介依照上述需求,针对百度搜索页面制定爬取规则可迅速获得搜索链接(百度搜索提供的链接,非正式链接)、标题、简介,如下:content = etree.HTML(response.text)res_title = content.xpath('//*[@id="%d"]/h3/a' % ((...原创 2019-09-20 16:07:52 · 2578 阅读 · 0 评论
分享