
python
GREENFLAVOUR
摘星种树谈理想
展开
-
2021-04-26 selenium的模拟登陆
模拟qq空间登陆from selenium import webdriverfrom time import sleepfrom selenium.webdriver import ActionChainsbro=webdriver.Chrome(executable_path='./chromedriver.exe')bro.get('https://qzone.qq.com/')bro.switch_to_frame('login_frame')a_tag=bro.find_elem原创 2021-04-26 22:19:22 · 157 阅读 · 1 评论 -
2021-04-07 python爬虫自学——异步爬虫
import time#使用单线程串行方式执行def get_page(str): print("正在下载:",str) time.sleep(2) print("下载成功:",str)name_list=['xiaozi','aa','bb','cc']start_time=time.time()for i in range(len(name_list)): get_page(name_list[i])end_time=time.time()print('原创 2021-04-09 21:25:04 · 209 阅读 · 1 评论 -
2021-4-6 python爬虫自学-——selenium动态/iframe
selenium模块的基本使用:问题:selenium模块与爬虫之间具有怎样的关联? - 便捷的获取网站中动态加载的数据 - 便捷的实现模拟登陆什么是selenium模块 - 基于浏览器自动化的一个模块。selenium使用流程: - pip install selenium - 下载一个浏览器的驱动程序 -实例化一个浏览器对象 -编写基于浏览器自动化的操作代码 -发起请求:get(url) -标签定位:fin原创 2021-04-06 19:08:43 · 410 阅读 · 1 评论 -
2021-04-04 python爬虫自学——bs解析/xpath解析
-数据解析的原理: -1.标签定位 -2.提取标签,标签属性中存储的数量的具体值-bs4数据解析的原理: -1.实例化一个【BeatifulSoup】对象,并且将页面源码数据加载到该对象中 -2.通过调用【BeatifulSoup】对象中相关的属性或者方法进行标签定位和数据提取-环境安装: -pip install bs4 -pip install lxml(解析器)-如何实例化【BeatifulSoup】对象: -from bs4 import原创 2021-04-04 21:29:11 · 416 阅读 · 2 评论 -
2021-4-1 正则表达式自学
正则表达式 re:首先impo re使用字符,转义字符和特殊字符组成一个规则,使用这个规则对文本的内容完成一个搜索或者匹配或替换的功能正则表达式的组成: 普通字符: 大小写字母,数字,符合…… 转义字符:\w,\W,\d,\D,\s,\S…… 特殊字符:. ?^+[]{}()…… 匹配模式:I U……re.match() 函数 从头开始匹配 要么第一个就符合要求,要么不符合 匹配成功则返回match对象,否则返回None 可以原创 2021-04-01 22:59:00 · 170 阅读 · 0 评论 -
2021-3-30 python爬虫自学
import requestsimport json#如何爬取图片数据if __name__=="__main__": #如何爬取图片数据 url='https://pic.qiushibaike.com/system/pictures/12419/124194520/medium/FQM9VTDAWFWWPUY0.jpg' #content返回的是二进制形式的图片数据 #text(字符串) content(二进制)json()(对象) img_data=...原创 2021-03-31 22:21:46 · 167 阅读 · 0 评论 -
2021-3-29 python爬虫自学
1import requestsif __name__=="__main__": url='http://scxk.nmpa.gov.cn:81/xk/' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome' '/89.0.4389.90 Safari/53原创 2021-03-29 22:30:02 · 133 阅读 · 0 评论 -
2021-03-27python爬虫学习
import requestsif __name__=="__main__": url='https://www.sogou.com/' response=requests.get(url=url) page_text=response.text print(page_text) with open('./sogou.html','w',encoding='utf-8')as fp: fp.write(page_text) print(...原创 2021-03-27 22:12:08 · 222 阅读 · 2 评论 -
python通讯录课程设计
最近自学了python,想到之前学c++的通讯录课程设计,就试着用来检验python的学习成果。import osfile_name='contact.txt'def menu(): print("=====================欢迎使用通讯簿=====================") print("*********************菜单*****************************") print("*原创 2021-02-07 00:40:25 · 2740 阅读 · 2 评论 -
2021-02-02 Python 自学总结
10-1 Python 学习笔记:在文本编辑器中新建一个文件,写几句话来总结一下你至此学到的 Python 知识,其中每一行都以“In Python you can”打头。将这个文件命名为learning_python.txt,并将其存储到为完成本章练习而编写的程序所在的目录中。编写一个程序,它读取这个文件,并将你所写的内容打印三次:第一次打印时读取整个文件;第二次打印时遍历文件对象;第三次打印时将各行存储在一个列表中,再在 with 代码块外打印它们。#读取整个文件file_path = 'D:\pt原创 2021-02-03 00:20:19 · 366 阅读 · 0 评论 -
2021-02-01 Python自学总结
9-1 餐馆:创建一个名为 Restaurant 的类,其方法__init__()设置两个属性:restaurant_name 和 cuisine_type。创建一个名为 describe_restaurant()的方法和一个名为 open_restaurant()的方法,其中前者打印前述两项信息,而后者打印一条消息,指出餐馆正在营业。根据这个类创建一个名为 restaurant 的实例,分别打印其两个属性,再调用前述两个方法。class Restaurant(): def __init原创 2021-02-02 00:25:04 · 660 阅读 · 0 评论 -
2021-01-31 Python自学总结<
8-1 消息:编写一个名为 display_message()的函数,它打印一个句子,指出你在本章学的是什么。调用这个函数,确认显示的消息正确无误。def display_message(): print("本章学习函数")display_message()8-2 喜欢的图书:编写一个名为 favorite_book()的函数,其中包含一个名为 title的形参。这个函数打印一条消息,如 One of my favorite books is Alice in Wonderland。调用这个原创 2021-01-31 22:21:49 · 150 阅读 · 0 评论