- 博客(8)
- 收藏
- 关注
转载 python中爬取网页数据时中文乱码的解决方法
在我们爬取网页源代码时,尝尝会出现中文乱码的问题,加入如下代码可解决问题,亲测有用。page_text = response.text.encode("latin1").decode("utf-8-sig")
2022-05-24 18:22:12
2745
1
原创 python爬取静态网页中的图片案例
文章目录前言一、正则解析的案例二、问题三、仅供学习使用前言聚焦爬虫的意思是爬取页面中指定的页面内容:数据解析包括正则解析bs4解析(python独有)xpath解析一、正则解析的案例我们爬取的是一家图片网站,网址是:https://desk.zol.com.cn/fengjing/1.htmlimport requestsimport osimport reif __name__ == "__main__": if not os.path.exists('./pictur
2022-05-24 12:34:18
413
原创 python爬取图片的注意点
我们在爬取数据时绝大部分是文字或者是数字,如果爬取的数据是图片,如何进行持久化存储呢?我们可以用content来返回二进制的图片数据。之后以wb模式写入文件。import requestsif __name__ == "__main__": url='https://fzn.cc/wp-content/uploads/2020/11/640-126.jpg' img_data = requests.get(url=url).content#content返回的是二进制形式的图片数据
2022-05-20 12:23:38
292
原创 python爬虫requests模块的编码流程
Requests模块的编码流程1.指定url url ='https://www.baidu.com/s?tn=25017023_5_dg&ch=1&ie=UTF-8'#1.指定url2.发送请求主要用到response.get()函数和response.post函数response.get()函数 response = requests.get(url=url,params=param, headers=head)#2.发起请求get函数的url参数就是你指定的url;
2022-05-16 01:24:30
2058
翻译 python绝对路径和相对路径
今天记录一下python绝对路径和相对路径的问题提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录一、绝对路径二、相对路径三、如何查看当前所在目录提示:以下是本篇文章正文内容,下面案例可供参考一、绝对路径E:\python\爬虫课件的三种表示方法①由windows下文件目录复制而来的路径,“\”在python中是作为转义符使用,所以在python中若想使用windows下的路径标识,前面要加一个r,r的全称是raw string,即原始字符串常量,可以让字符保持原来的
2022-05-15 00:33:49
17090
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人