- 博客(9)
- 收藏
- 关注
原创 爬虫库的基本使用(3)
request库 --第三方库Requests是用python语言编写的,基于urllib,但是它比urllib更加方便,可以节约我们大量的工作,完全满足HTTP测试需求。#安装requestspip install requests基本使用发送get请求:resp=requests.get('http://www.baidu.com')import requests#添加headers和查询参数headers={'User-Agent': 'Mozilla/5.0 (Windows
2021-01-28 15:45:09
167
1
原创 爬虫基本库的使用(2)
CookieCookie:指某些网站为了辨别用户身份,进行session跟踪而储存在用户本地终端上的数据。cookie的格式:Set-Cookie:NAME=VALUE;Expires/Max-age=DATE;Path=PATH;Domain=DOMAIN_NAME;SECURE参数的含义:NAME:cookie的名字VALUE:cookie的值Expires:cookie的过期时间Path:cookie作用的路径Domain:cookie作用的域名SECURE:是否只在https协
2021-01-27 19:32:27
96
原创 爬虫基本库的使用
urllib库urllib库是python中一个最基本的网络请求库。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。(python标准库)urlopen函数在python3的urllib库中,所有和网络请求相关的方法,都被集到urllib.request模块中:from urllib import requestresp=request.urlopen("http:www.baidu.com")print(resp.read())urlopen函数详解创建一个
2021-01-22 17:53:05
217
1
原创 爬虫基础
爬虫介绍通俗的讲:爬虫是一个模拟人类请求网站行为的程序。可以自动请求网页、并把数据抓取下来,然后使用一定的规则提取有价值的数据。爬虫应用场景:搜索引擎(百度或谷歌等)伯乐在线。惠惠购物助手。数据分析。抢票软件等。爬虫开发工具安装安装Python:下载地址:https://www.python.org/或者使用Anaconda:https://www.anaconda.com/哪个软件无所谓,只要是Python3.6以上的版本就可以了。安装Pycharm:Pycharm Com
2021-01-17 17:03:16
691
原创 Python常用模块(2)
IO操作之文件读写文件读写的一般方法f=open("path","模式")f.read()f.write("字符串\n")f.close()#关闭保存with open("","") as f:#此时可以不使用close() f.write("")f.seek(0)#指针在最开始for line in f: print(line,end="")模式说明r以读的方式打开文件。默认打开方式w以写的方式打开文件。如果文件已存在,则覆盖文件,否则新建文件
2021-01-13 16:50:30
116
原创 python常用模块
标准库和第三方包import modulefrom module import XXX #容易引起命名冲突import module as other_name#安装pip install package_name#第三方包来源https://pypi.org/编写和搭建模块#可调试模块,导入模块时不执行调试if __name__=="__main__":#python模块路径import sys sys.path#添加路径sys.path.append("")包包:
2021-01-12 18:33:43
143
原创 面向对象编程(class)
面向对象编程(class)理解创建类的基本方法类(class):是一种面向对象的计算机编程语言的构造,是创建对象的蓝图,描述了所创建的对象共同的属性和方法。一个类的实列:class SuperMan: '''A class of superman ''' #初始化方法 def __init__(self,name): self.name=name #属性 self.gender=1 self.single=False self.illness=False #普通方法 de
2021-01-10 17:27:40
1200
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人