
Python网络爬虫
Vicky_xiduoduo
这个作者很懒,什么都没留下…
展开
-
[解决问题]UnicodeEncodeError: ‘gbk‘ codec can‘t encode character ‘\ue615‘ in position 295852
在写爬虫时,用了request获取网页页面源代码,具体代码如下:import requestsurl = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=62095104_19_oem_dg&wd=周杰伦'headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.3原创 2022-05-20 21:56:00 · 218 阅读 · 0 评论 -
Python网络爬虫--服务器/客户端渲染
Web请求过程剖析1. 服务器渲染(SSR)服务器在返回html之前,在html特定的区域特定的符号里用数据填充,再给客户端,客户端只负责解析Html。鼠标右击可以查看页面代码,性能消耗在服务器端,用户达到一定程度的时候,后端会考虑缓存。部分数据,避免消耗过多的资源重复渲染。优点:前端耗时少,首次渲染快,更快的内容到达时间。缺点:网络运输数据量大,占用部分服务器运算资源;用户体验差;不容易维护,前端修改部分html/css后端也要改。2.客户端渲染(CSR)通过约定好的API交互原创 2022-05-20 21:44:27 · 785 阅读 · 0 评论