凛铄linshuo-优快云博客

原创为什么用F12打开谷歌刷新之后显示“未连接到互联网”

设置好了之后记得关闭调试窗口，重新刷新一下，再F12。

2025-06-27 16:34:58 68

原创爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码

本文介绍了一个简单的贴吧爬虫框架实现。该爬虫主要包含以下功能：初始化组件：设置贴吧名称、基础URL和请求头 URL构造：通过列表推导式生成指定页数的贴吧URL 请求获取：使用requests获取网页HTML源码本地保存：将获取的HTML按页数保存为本地文件核心代码使用面向对象方式组织，包含TiebaSpider类，通过run()方法串联整个爬取流程。该爬虫可实现指定贴吧前10页内容的抓取，每页数据保存为单独HTML文件，文件名包含贴吧名称和页数信息。代码简洁高效，使用了列表推导式和format字符串格

2025-06-26 22:11:53 106

原创爬虫：一定要知道的requests整体架构

本文展示了一个简单的爬虫程序框架。代码定义了一个XXSpider类，包含初始化方法和核心业务逻辑方法run()。程序通过requests模块实现爬虫功能，并采用if name == 'main'的标准Python执行方式启动爬虫实例。该代码结构清晰，可作为爬虫开发的基础模板，适合初学者学习基本的爬虫编程框架。

2025-06-26 17:03:23 68

原创爬虫：3.掌握requests库

Python requests库使用指南 requests库是Python中最常用的HTTP请求库，可用于发送网络请求和获取响应数据。文章介绍了requests的基本用法，包括发送GET请求、处理编码问题（response.text与response.content的区别）、获取状态码和请求头信息。重点讲解了如何伪装请求头(User-Agent)和发送带参数的请求(params)，并以爬取豆瓣电影搜索为例进行了演示。此外，还展示了如何保存图片到本地。文章提醒要遵守robots协议，避免暴力爬取，并给出了一个

2025-06-26 16:27:23 351

原创爬虫：1.HTTP协议

通过cookie将客户端的用户访问足迹发送给服务器，下次服务器就可以推送类似的东西给你，所以记得定时清理浏览器缓存，毕竟cookie不够安全，存在客户端上。模拟登录时候，可能会用到host、user-agent、cookie，比如有些要爬的页面是要登录之后才能访问到的，直接爬爬不到，要带上登录信息。Server: BWS/1.1 （百度自己的服务器，一般服务器用阿帕奇Apache或恩吉尼克斯Nginx）user-agent是访问的电脑类型，浏览器类型版本（服务器可以判断是不是爬虫）post——表单提交；

2025-06-25 18:44:50 409

原创学习爬虫中requests库的建议路线

requests库需要掌握的技术

2025-06-12 17:29:07 405

原创记录一下自动化和爬虫现在的主流技术

通过 Browser 类，可以启动一个浏览器实例，模拟用户在浏览器中的操作，如访问网页、填写表单、点击按钮等。Playwright：由Microsoft开发，支持多浏览器，自动化操作高效，支持无头模式2。Selenium：广泛用于Web自动化测试，能够模拟用户在浏览器中的操作，支持多种浏览器1。Scrapy：一个功能强大的爬虫框架，支持异步和分布式爬取，适合大型、复杂的爬虫项目12。Requests：用于发送HTTP请求，简单易用，是爬虫获取网页内容的基础库14。中的 Browser 类，它提供了一个。

2025-06-12 17:24:55 254

原创爬虫简单实操1——爬取一张豆瓣图片

本文详细介绍了网络爬虫请求与响应的原理及实际操作。首先解析了请求的三要素：请求行（含URL和方法）、请求头（关键headers数据）和请求体（参数）；接着说明响应包含状态行、响应头和响应体。通过豆瓣电影案例，演示了如何使用requests库进行抓包分析、UA伪装解决反爬机制（418状态码转为200），以及图片爬取保存的具体实现。代码示例包括获取网页源码、处理二进制图片数据并本地存储的完整流程，为爬虫初学者提供了清晰的技术指导。

2025-06-12 17:17:28 897

原创爬虫：2.web请求响应的过程（概念为主）

我们的电脑请求别人的电脑后，别人的电脑给了我们一个框架，我们再请求数据，得到数据和框架后，我们在自己的电脑上组装渲染好了呈现出来。我们的电脑请求别人的电脑，然后别人的电脑上组装好数据再发送给我们，呈现在我们的电脑上（秒显示）找到了，这个在本地渲染出来的数据（这类数据会在打开网址后缓慢显示出来，因为需要时间加载）点击Fetch/XHR，刷新一下，就能看到一些网址，从这里面找寻第二次请求得到的网址。查找经过第二次请求的数据：后台抓包 F12 - Network（网络）怎么看请求的是哪一个网址，看它的【标头】

2025-06-12 15:50:16 275

cs77711的博客

原创为什么用F12打开谷歌刷新之后显示“未连接到互联网”

原创爬虫简单实操2——以贴吧为例爬取“某吧”前10页的网页代码

原创爬虫：一定要知道的requests整体架构

原创爬虫：3.掌握requests库

原创爬虫：1.HTTP协议

原创学习爬虫中requests库的建议路线

原创记录一下自动化和爬虫现在的主流技术

原创爬虫简单实操1——爬取一张豆瓣图片

原创爬虫：2.web请求响应的过程（概念为主）

原创什么是爬虫？

原创爬虫selenium库基础操作

原创 weditor安装

原创 uiautomator2-功能使用

转载 uiautomator2-adb报错CreateProcessW failed: 系统找不到指定的文件

原创 uiautomator2 VS appium

原创 uiautomator2-快速入门app自动化测试-从配置环境到测试

原创 uiautomator2——开发者模式配置 / 想用手机WiFi地址连接设备，但是报错：raise ConnectError(f“device {self._serial} not online“)

原创 pytest学习（1）学会使用pytest测试一个用例

原创 python打包的exe在自己电脑上可以正常运行，发给对方结果闪退或报错该如何解决

原创 python如何把.py文件打包成exe程序

原创当你测试if语句发现两个字符串明明内容一样却无法用==

原创实例操作：购物网站首页、登录及注销的实现（JSP+JDBC）

原创实例操作：用户登录程序实现（JSP+JDBC实现）

原创 eclipse新建项目后java build path的libraries下add libraries按钮是灰色（全部灰色）

转载使用eclipse创建我的第一个JSP项目

转载 DOS命令（系统错误5，拒绝访问）的解决方法

空空如也

空空如也