- 博客(4)
- 收藏
- 关注
原创 爬虫 .content 和 .text 的用法区别
requests对象的get和post方法都会返回一个Response对象,这个对象里面存的是服务器返回的所有信息,包括响应头,响应状态码等。其中返回的网页部分会存在.content和.text两个对象中。.content中间存的是字节码 .text存的是.content编码后的字符串一般来说 .text直接用比较方便 返回的是字符串 但是有时候会解析不正常导致返回的是一堆乱码这时用.conten...
2018-06-25 16:46:59
4989
1
原创 正则小记
爬虫 正则小记 用正则做爬虫的三个步骤: 向请求的页面发送请求,获取源代码(静态页面)利用正则匹配数据将数据保存到数据库实例:string = """ <html> <div><a href='www.baidu.com'></a></div></div&am
2018-06-14 21:04:58
187
原创 Cookie 免登录
六月十一号 周一 晴 我是一只小菜鸟 请多指教 (期待第一个留言)cookie:是在浏览器(客户端)存储的一些键值对信息,cookie的值是由服务器返回的,浏览器会自动解析这些数据,并将其缓存到本地。请求头中:Cookies,浏览器发送请求的时候携带的信息。响应头中:Set-Cookie,服务器响应头中携带的信息。http协议是一个无状态的协议。只要通过http发送请求,请求和请求...
2018-06-11 19:43:29
603
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人