
python
文章平均质量分 53
步行僧
这个作者很懒,什么都没留下…
展开
-
python字符串转换成字典
python字符串转换成字典原创 2024-03-13 11:36:41 · 2815 阅读 · 1 评论 -
解决python爬取到网页信息中带有\u开头的字段
python爬取到网页信息中带有\u开头的字段原创 2024-03-11 10:51:30 · 690 阅读 · 0 评论 -
python使用Selenium自动化测试网页功能
在动态加载的网页中,python使用Selenium自动化测试网页功能,自动点击隐藏菜单出现错误信息,表示你试图点击的元素被另一个元素遮挡,因此无法直接点击。这通常发生在动态加载的网页中,当你试图点击一个元素时,另一个元素突然出现在前面,阻止了你的点击。原创 2023-12-22 16:23:01 · 488 阅读 · 0 评论 -
Python对PDF文档操作第三方库PyPDF库功能介绍
Python对PDF文档操作第三方库PyPDF库功能介绍原创 2022-03-17 11:33:17 · 1801 阅读 · 0 评论 -
大众点评文字加密反爬Python
本文将 大众点评字体反爬方法及完整程序进行注释讲解,亲测有效!!!原创 2022-02-10 09:43:48 · 2033 阅读 · 3 评论 -
Python爬取网页判断网页中某个标签是否存在
Python爬取网页判断网页中某个标签是否存在,使用find_element_by_xpath()方法,即可完成 try: school.find_element_by_xpath('./td[7]/text()') school_privates = school.xpath('./td[7]/text()').extract()[0] if school_privates:原创 2021-12-02 14:13:18 · 3260 阅读 · 0 评论 -
Python3用scrapy爬取https页面,提示[(‘SSL routines‘, ‘tls_process_ske_dhe‘, ‘dh key too small‘)]
在Python3中,使用scrapy爬取https网页数据过程中,遇到以下错误提示,经过不断调试,终于完成该问题的解决方式:1、问题错误提示信息Traceback (most recent call last):File “/usr/lib/python3/dist-packages/scrapy/core/downloader/middleware.py”, line 44, in process_requestdefer.returnValue((yield download_func(requ原创 2021-12-02 09:10:03 · 2567 阅读 · 0 评论 -
python3实现查找文件和目录
在当前目录以及当前目录的所有子目录下查找目录和文件,并打印出相对路径:以下是实现源码:from pathlib import Pathimport sysimport argparsedef name_find(start, args):for f in start.rglob(args.name):print(f)def type_find(start, args):if args.type not in [‘d’,‘f’]:print(f"Unknown type: {args.ty原创 2021-07-20 09:43:35 · 522 阅读 · 0 评论 -
python实现多线程爬取动态表情
@python实现多线程爬取动态表情这里写目录标题主题一、爬虫部分二、多线程类的构造三、其他辅助内容主函数主题在网上练习项目项目,看到这个表情包爬取,刚好也解决一下自己的表情库存告急情况主要是包含了爬虫部分和多线程类的构造两大部分一、爬虫部分直接上代码def downloads_img(url, path): headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/原创 2021-06-22 20:55:31 · 405 阅读 · 0 评论 -
学习scrapy框架
模块与框架的区别:模块:能被借助实现所需功能的一些工具1、确定url地址2、发送网络请求 requests、urllib3、解析数据 parsel 、lxml、 bs4、、、4、数据保存 csv 、 json框架:一整套解决方案(只需要写业务逻辑) 数据管道保存数据学习成本较高(语法/框架源码) scrapy、pyspider.. scrapy框架内容: 1、scrapy.cfg:配置文件 2、setting.py :项目配置文件 3、pipelines.py: 数据管原创 2021-05-23 22:29:28 · 130 阅读 · 0 评论 -
Xpath学习
“”"XPath的学习“”"from lxml import etree案例文件html_doc = “”" baidu myblog myblog2 csdn bbb aaa"""html = etree.HTML(html_doc)1、获取所有li下的所有a标签print(html.xpath("//li/a"))#2、获取指定的li标签item-0print(html.xp原创 2021-04-14 09:52:40 · 419 阅读 · 0 评论 -
python3爬取小说
#-- coding:UTF-8 --from bs4 import BeautifulSoupimport requests,sys“”"类说明:下载《穷爸爸富爸爸》modify:2020-12-23Author:ZhiT涛“”"class download(object):def init(self):self.server_url = ‘http://www.mingzhuxiaoshuo.com’self.target_url = ‘http://www.mingzhuxi转载 2021-01-12 11:49:54 · 231 阅读 · 0 评论 -
Windows系统git 环境搭建
1、git下载和安装git下载,国外官网地址一般下载很慢,可以使用国内淘宝镜像地址,版本根据电脑使用系统合理选择,提供地址如下git官网:https://git-scm.comgit镜像:https://npm.taobao.org/mirrors/git-for-windows2、双击刚刚下载的git版本,例如我下载的是Git-2.22.0-64-bit.exe,点击运行,阅读说明,点击Next选择安装目录(一般我喜欢放在其他盘),点击Next,选组件,直接默认,点击N...原创 2020-05-09 09:49:14 · 1282 阅读 · 0 评论