
爬虫
文章平均质量分 75
星火燎愿
变得更优秀
展开
-
seleinum调用chrome长时间运行后出现崩溃
处理解决seleinum调用chrome长时间运行,出现崩溃的问题原创 2022-05-30 18:07:25 · 4601 阅读 · 2 评论 -
python获取threading多线程的return返回值
我们正常使用 threading 模块创建的线程是无法获取它所执行方法的返回值的;如:w = threading.Thread(target=worker,args=(i,))一、重写线程,获取线程return返回值要想获取线程中执行方法return的返回值,就需要重新定义 threading 的类,也就是常说的 继承、重写;代码:# -*- coding: utf-8 -*-import threading,time"""用类包装线程;调用时可以获取线程的return原创 2020-11-07 09:32:49 · 25625 阅读 · 2 评论 -
股价翻番 人生赢家,python爬取基金 筛选股票
前言:听说你想要变富?那就沉住气慢慢来吧,没听过这句名言么:“穷人总是不想慢慢的变富”。都想着一夜暴富,中个彩票啥的,可哪有那么幸运呢?总不能像我一样中了78万的彩票,然后自己偷偷的花吧。想要慢慢的变富有,只要理好财就可以了;小钱靠攒,大钱靠赚!之前我也曾苦于思索如何让自己实现财富自由,所以才有了学习理财的想法,说到理财就不得不说一些理财产品,比如黄金、期货、股票、基金等,先普及一下这些小...原创 2020-01-04 12:56:15 · 1856 阅读 · 1 评论 -
DeprecationWarning: use options instead of chrome_options 问题的解决
使用 selenium可以调用 谷歌、火狐等浏览器进行爬虫的爬取,但当我运行:from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionschrome_options = Options()chrome_options.add_argument('--headless')dri...原创 2019-11-28 21:27:55 · 23396 阅读 · 11 评论 -
爬虫+正向代理,30+行代码我爬取了[链家]3000+条数据
北京这么大,总有一套房子适合自己;一、选择目标网站:链[lian]家[jia]:https://bj.lianjia.com/点击【租房】,进入租房首页:这就是要爬取的首页了;二、先爬取一页1、分析页面右击一个房源的链接,点击[检查],如图:进入开发者模式,此时可以看到 a 标签中的链接:使用 xpath 就可以把链接提取出来,不过该链接是真实 url...原创 2019-11-19 21:49:05 · 553 阅读 · 0 评论 -
小白的python爬虫,40代码教你爬取豆瓣
直接上代码:import requestsfrom bs4 import BeautifulSoupfrom lxml import etree#抓取豆瓣小说的 书名、评分;page = 0 #定义页数初始值;lists_book = [] #定义书名列表;lists_grade = [] #定义评分的列表;for u in range(...原创 2019-09-04 10:39:38 · 341 阅读 · 0 评论 -
30行python代码爬取历年双色球
爬取的目标链接:http://kaijiang.zhcw.com/zhcw/html/ssq/list_1.htmlpython版本:3.7;开发工具:pycharm;前言:爬取这个双色球数据也是当初想学爬虫的目的之一,本篇文章仅获取了所有的历史数据;后期会使用数据可视化和数据分析等python技能对此数据进行分析。下面直接上代码了;import sysimport req...原创 2019-09-22 15:04:50 · 1671 阅读 · 3 评论