- 博客(20)
- 收藏
- 关注
原创 chromedriver下载地址
https://willkkc.blog.youkuaiyun.com/article/details/104783059?spm=1001.2101.3001.6650.7&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-7.essearch_pc_relevant&depth_1-utm_source=distribute.pc_relevant.none-ta
2021-10-31 08:45:59
130
原创 爽
成功实现自动提取图片文字,又打包成exe,一周以来的不顺手感觉一扫而空#coding=utf-8'''from selenium import webdriverdriver=webdriver.Chrome()driver.get('https://fanyi.baidu.com/?#zh/en/政治')shangchuan=driver.find_element_by_class_name("input-operate")shangchuan.click()'''from aip impo
2021-04-18 22:10:46
148
原创 后续跟进爬虫
#import requestsimport openpyxlfrom bs4 import BeautifulSoupfrom lxml import htmlimport timefrom selenium import webdriverwb=openpyxl.load_workbook('4月3日6点速卖通.xlsx')sheet=wb['Sheet1']col=sheet['A']headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.
2021-04-07 23:22:21
136
原创 bs获取p标签下的i标签
fensb=bs.find(‘p’,class_=“num-followers”)fens=fensb.find(‘i’).text
2021-04-07 23:19:22
188
原创 打印今天月日
import datetimetoday=datetime.date.today()print(today)rq=str(today)x=rq.replace('2021-','')print(x)
2021-04-03 20:23:32
95
原创 爬速卖通新品
from selenium import webdriver #import timefrom selenium.webdriver.common.action_chains import ActionChains #行为链from bs4 import BeautifulSoupimport openpyxlwb=openpyxl.Workbook() #建工作簿sheet=wb.active #建活动表driver=webdriver.Chrome()#driver
2021-04-03 18:32:47
262
1
原创 很久不练之后,解决加载不了全部页面问题
from selenium import webdriver #import timefrom selenium.webdriver.common.action_chains import ActionChains #行为链from bs4 import BeautifulSoupimport openpyxlwb=openpyxl.Workbook() #建工作簿sheet=wb.active #建活动表driver=webdriver.Chrome()#driver
2021-04-03 16:35:07
87
原创 制作最简单的词云图
from wordcloud import WordCloudwith open('test.txt',encoding='utf-8') as file: # 1.读取文本内容 text=file.read() #设置词云的背景颜色,宽高,字数 wordcloud=WordCloud(background_color='green',width=600,height=300,max_words=50).generate(text) #3.生成图片 ima
2021-03-15 17:57:47
181
原创 判断括号是否成对出现,不考虑‘)‘
s='cdf(d(h(fvv)gd(df0)h(jd)f)d()dj(fgdjjh)jjhg'zt=Truewhile zt: xh=1 for i in range(len(s)): if xh==0: break if s[i]==')': sq=s[0:i+1] for k in range(i,-1,-1): if sq[k]=='(':
2021-02-10 07:15:48
158
原创 模拟获取武将
import randomimport openpyxlimport timen1=int(input('输入要开箱次数:'))n=1cflb=0while n<=n1: r=random.randint(1,10001) #rint(r) #加载Excel文件(创建一个Python中的工作簿对象) wb=openpyxl.load_workbook('三国杀灵宝概率.xlsx') sheet=wb['Sheet1'] col=sheet['
2021-02-06 17:52:29
128
原创 无重复字符的最长子串
s=‘abcdhfghstgjhffysfdsdgjshjjtrssfgjujfdaa’l=[]lenc=[]for i in s:if i not in l:l.append(i)print(l)elif i in l:ind=l.index(i)del l[0:(ind+1)]l.append(i)print(’-------------’)lenc.append(len(l))print(max(lenc))
2021-02-04 17:41:27
79
原创 #12.list1=[2,3,5,4,9,6],从小到大排序,不许用sort,输出[2,3,4,5,6,9]
l12=[2,3,5,4,9,6]l121=[]for i in range(0,100): if i in l12: l121.append(i)print(l121)
2021-01-31 14:09:54
1053
原创 粗略的用selenium爬取相关文章题目
from selenium import webdriverfrom bs4 import BeautifulSoupfrom lxml import htmlimport requestsimport timedriver=webdriver.Chrome()driver.maximize_window()driver.implicitly_wait(10)driver.get('https://so.youkuaiyun.com/so/search?q=selenium&t=&u
2021-01-28 16:02:18
113
原创 爬取大神文章到Word文档
import requestsfrom bs4 import BeautifulSoupimport refrom lxml import htmlimport docxurl='https://blog.youkuaiyun.com/u011541946/category_7006637.html'headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) C
2021-01-26 12:31:18
174
原创 xpath直接拿链接
**et=html.etreehtmls=et.HTML(resp.text)link_lst=htmls.xpath('//ul[@class="column_article_list"]/li/a/@href')for link in link_lst: print(link)**
2021-01-25 15:40:21
2097
原创 简单输出杨辉三角
这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入def l(n):if n1:return 1if n2:return [1,1]if n>2:l1=[]
2021-01-25 12:49:41
139
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人