
Python
LittleDragorse
有任何问题可以留言,我们共同进步!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python之装饰器用法
使用装饰器的基本知识与用法原创 2023-02-28 17:16:20 · 217 阅读 · 0 评论 -
python之matplotlib作图技巧
matplotlib作图技巧原创 2023-02-15 21:32:11 · 187 阅读 · 0 评论 -
Selenium使用总结
创建使用代理的无头浏览器 def get_driver(proxy={'ip': ip, 'port': port}): chrome_options = webdriver.ChromeOptions() chrome_options.add_argument('--headless') chrome_options.add_argument('--proxy-server=h...原创 2019-05-30 18:10:37 · 216 阅读 · 0 评论 -
Python重要包及其简要用法
pdfplumber OMG!怎么会有这么好用的pdf解析包? import pdfplumber pdf = pdfplumber.open(file_name) for page in pdf.pages: text = page.extract_text() 中文也好用!真是太强大了! ...原创 2019-05-10 21:58:37 · 732 阅读 · 0 评论 -
linux常用命令及其python调用
文件及文件夹夹操作 以下path指路径名称,filename指文件名,-args指可用多种参数 文件夹操作 linux命令 作用 python调用 pwd 展示当前路径 cd path 切换文件夹 ls path 展示文件夹内容 os.listd......原创 2019-04-26 17:48:46 · 551 阅读 · 0 评论 -
Scrapy爬虫框架学习
目录 五大模块 Downloader Spider ItemPipeline Schedule Engine 四个配置参数 三个对象 scrapy.http.Request 常用属性 常用方法 Response 常用属性 常用方法 Item 两类中间件 DownloaderMiddleware SpiderMiddleware 五大模块 Downloa...原创 2019-04-29 01:28:07 · 180 阅读 · 0 评论 -
re库的使用及正则表达式
常用正则表达式 from re import compile percent = compile('([1-9]?[0-9]|100)%’) # 百分比 date = compile(r'20\d{2}-(0[1-9]|1[012])-(0[1-9]|[12]\d|3[01])’) time = compile("([01]\d|2[0-3]):([0-5]\d):([0-5]\d)") w...原创 2019-04-25 00:11:39 · 314 阅读 · 0 评论 -
Python爬虫反反爬总结
针对以下各反爬手段的反制措施 Headers 最基本的反爬手段,一般被关注的变量是UserAgent和Refer,可以考虑使用浏览器里的。其中的ContentLength字段requests包会填写,可以不用。Content-Type字段是post表单的格式,必须和网站的一样。 UA 待续 拉黑高频访问IP 数据量大用IP池(伪装成多个访问者),爬取速度要求低用sleep()(伪装成人...原创 2019-04-25 15:06:28 · 465 阅读 · 0 评论 -
PythonHTML解析
目录 BeautifulSoup 基础方法 基本元素 Tag Name Attributes NavigableString Comment 下行遍历 tag.contents tag.children tag.descendants 上行遍历 tag.parent tag.parents 访问平行节点 tag.next_sibling tag.next_...原创 2019-04-25 19:51:06 · 806 阅读 · 0 评论