- 博客(27)
- 收藏
- 关注
原创 提取文件名
记事本全部提取文件夹的文件名的方法:(1)打开记事本;(2)输入代码:dir *.* /B >xxx.txt(3)另存到指定文件并把扩展名txt改成bat;(4)双击bat文件;(5)打开生成的文本文件并把制作的bat文件和文本文件删除;(6)复制文件名到word或Excel文档并保存。
2024-07-16 17:06:10
625
原创 图片链接批量转成图片
5、再将txt文本中的所有链接,复制到表格的 D列。1、所有的链接复制到表格中,例如复制到 B列。4、将C列表格的内容复制到一个txt的文本中。7、然后,全选图片,右键,将图片嵌入表格中。6、稍等片刻,变成图片。3、双击 C列 表格。
2023-08-31 16:23:17
8437
2
原创 获取图片的xpath
# 如果不存在piclibs文件夹,那就新建一个. if not os.path.exists('./Libs'): os.mkdir('./Libs') for li in li_list: img_src='https://pic.netbian.com/'+li.xpath('./a/img/@src')[0] # 局部解析 @src img_name=li.xpath('./a/img/@alt')[0]+'.jp.
2021-09-22 17:40:14
363
原创 selenium: 爬取链接的方法
element=bro.find_element_by_xpath('//[@id="J_goodsList"]/ul/li[1]/div/div[3]/a[@href]')print(element.get_attribute('href'))
2021-09-22 12:20:12
1734
原创 重新安装python
cd进入python位置:先安装 pinpython -m ensurepip更新 pinpython -m pip install --upgrade pip
2021-09-13 23:32:32
309
转载 python遍历txt文件的 5种方法
#方法一:直接遍历法,按行读取,每行返回一个字符串类型f1= open("C:/Users/Administrator/Desktop/qj_ly_product_list.txt",'r',encoding= 'UTF-8')for i in f1: print(i,end = '')#方法二::read法,如果指定了参数 size,就按照该指定长度从文件中读取内容.否则,可以一次读取文件的全部内容,Python把内容读到内存,用一个str对象表示,被读出来的内容,全部塞到一个字符串里面..
2021-09-13 11:47:55
10910
1
转载 selenium: xpath 选择元素
绝对路径: /elements = driver.find_elements_by_xpath("/html/body/div")css表达式html>body>div相对路径: //elements = driver.find_elements_by_xpath("//div//p")如果使用CSS选择器,则为divp通配符: /如果要选择所有div节点的所有直接子节点,可以使用表达式//div/**是一个通配符,对应任意节点名的元素,等价于...
2021-09-06 18:18:46
494
转载 selenium: 鼠标右键点击、双击、移动鼠标到某个元素、鼠标拖拽
通过 Selenium 提供的ActionChains类来实现from selenium import webdriverdriver = webdriver.Chrome(r'f:\chromedriver.exe')driver.implicitly_wait(5)driver.get('https://www.baidu.com/')from selenium.webdriver.common.action_chains import ActionChainsac ..
2021-09-06 14:16:08
3347
转载 selenium 窗口切换
切换到frame使用 WebDriver 对象的 switch_to 属性, frame_reference 可以是 frame 元素的属性 name 或者 IDwd.switch_to.frame(frame_reference)比如这里,就可以填写 iframe元素的id ‘frame1’ wd.switch_to.frame('frame1')或者 name属性值 ‘innerFrame’wd.switch_to.frame('innerFrame')也可以填写fr..
2021-09-06 13:35:52
569
转载 selenium 中 css-寻找元素
等同于 tag名,不改变.elements = wd.find_elements_by_css_selector('div')elements = wd.find_elements_by_tag_name('div')id值, 加上#: #id值element = wd.find_element_by_css_selector('#searchtext')element.send_keys('你好')class值, 加上. : . class值elements = ...
2021-09-06 11:41:38
715
转载 selenium 中 普通-寻找元素
# 导入Select类from selenium.webdriver.support.ui import Select# 创建Select对象select = Select(wd.find_element_by_id("ss_single"))# 通过 Select 对象选中select.select_by_visible_text("老师")...
2021-09-06 10:21:50
182
原创 json格式转成表格格式
import jsonimport pandas as pddf=pd.read_json('./公告遴选苏州.json',lines=True,encoding='utf-8')# print(df.columns)cols=list(df.columns)# 先删除,然后移动,标题交换cols.insert(0,cols.pop(cols.index('招标人')))# 内容交换,通过索引赋值df=df.loc[:,cols]# 创建一个表格df.to_excel('./wang.
2021-08-24 11:39:13
1526
原创 保存文件到本地
1.文字保存成文档h_list=etree.HTML(page_text)div_list=h_list.xpath('//section[@class="list"]/div')fp=open('5.txt','w',encoding='utf-8')for div in div_list: title=div.xpath('./a/div[2]/div/div/h3/text()')[0] fp.write(title+'\n')2. 图片保存到文件夹# 如果不存在.
2021-08-24 11:37:46
138
原创 scrapy 图片下载不了到本地
显示错误: DEBUG: Crawled (301)处理:在setting中加上: MEDIA_ALLOW_REDIRECTS = True
2021-08-23 21:21:25
342
原创 selenium: 全屏往下拉
for i in range(100): js = 'window.scrollTo(0,%s)'%(i*100) bro.execute_script(js) sleep(0.5)
2021-08-13 10:49:53
107
原创 xpath 空文档
1、检查xpath中是否有tbody如://*[@id="main"]/div[2]/table/tbody/tr[2]/td/table/tbody/tr[3]/td[2]有tbody,只需要将 tbody 删掉即可。
2021-08-04 14:11:06
190
原创 文本乱码的情况
方法一:response=requests.get(url=url,headers=headers)response.encoding='utf-8'page_text=response.text方法二:只需要针对乱码的属性值处理就行。img_name=li.xpath('./a/img/@alt')[0]+'.jpg'img_name=img_name.encode('iso-8859-1').decode('gbk')...
2021-08-04 11:31:48
186
翻译 Python 快捷键
编辑(Editing)Ctrl + Space 基本的代码完成(类、方法、属性)Ctrl + Alt + Space 快速导入任意类Ctrl + Shift + Enter 语句完成Ctrl + P 参数信息(在方法中调用参数)Ctrl + Q 快速查看文档Shift + F1 外部文档Ctrl + 鼠标 简介Ctrl + F1 显示错误描述或警告信息Alt + Insert 自动生成代码Ctrl + O 重新方法Ctrl + Alt + T 选中Ctrl + / 行注释Ctrl + Shift + / 块
2021-07-27 14:09:25
150
原创 xpath解析报错:lxml.etree.XPathEvalError: Invalid expression
反斜杠的问题for li in li_list: img_src=li.xpath('.a/img/@src')for li in li_list:img_src=li.xpath('./a/img/@src')
2021-07-22 13:08:36
1472
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人