李乾星-优快云博客

IDM 默认列表支持文件类型较少，可以点击下面的复制按钮覆盖更多常见后缀名，可以直接覆盖 IDM 的配置，修改完成后记得重启 IDM。比如：一个文件名叫，后缀 pkg 不在上面的列表里，这时需要手动将后缀（注意改成大写）添加到上面的文本框中。打开 IDM ，将自己的浏览器加入 IDM 的捕获列表中。把要支持 IDM 下载的后缀名添加到 IDM -> 里。首先检查浏览器是否安装了 IDM 扩展，若没有安装，，拖动到扩展页面安装。

2023-10-27 22:01:35 4202

原创 Python自学指南-第一章-安装运行

python与pycharm的安装与虚拟环境配置的讲解

2023-10-25 19:20:53 1155

原创 PyCharm 自定义文件和代码模板

文件模板是预定义的文件内容，可以为您提供一个开发项目或特定文件类型的基本框架。通过使用模板，开发者可以确保新创建的文件具有相同的基本结构和格式。

2023-08-25 15:18:59 5317 1

原创 Selenium 4 窗口处理

在Selenium自动化测试中，窗口处理是一个重要的技术。随着Selenium 4的发布，窗口处理功能得到了大幅改进和增强。本文将介绍如何使用Selenium 4来处理窗口操作。

2023-08-09 16:01:58 2977

原创 Selenium 4 - 控制浏览器的历史记录

在自动化测试中，控制浏览器的历史记录（后退和前进）是一个重要的任务。Selenium 4 提供了简单而强大的方法来模拟用户在浏览器中的导航行为。本教程将向您展示如何使用 Selenium 4 进行浏览器历史记录的后退和前进操作。为了更好地演示前进和后退操作，我们可以先访问一个具有多个链接的网站，比如菜鸟教程。可以随意点击其中一个标题，然后进行前进和后退的操作。这样能更清晰地展示 Selenium 4 控制浏览器历史记录的功能。

2023-08-08 18:01:59 603

原创 Selenium 等待方式详解

显式等待是一种在测试自动化中常用的等待方式，它可以让脚本在执行过程中等待某个特定条件变为真时再继续执行。显式等待适用于需要等待某些特定条件才能继续执行测试的情况，例如等待页面元素加载完成、等待异步操作完成等。在上面的示例中，我们创建了一个WebDriver实例，并使用显式等待来等待页面标题包含“优快云”文本。虽然强制等待在特定的场景下可能是必要的，但请尽量避免过度使用它，并在可能的情况下选择更灵活和准确的等待方式，例如显式等待或条件等待。在上面的示例中，我们使用显式等待等待文本框中的值被清除。

2023-08-08 17:17:40 2295

原创 requests模块-verify参数与ca证书

通过这种方式，你可以绕过SSL证书验证，但请务必确保你所访问的网站是可信的，以避免潜在的安全风险。文章中讲解这个解决方案时，需要明确强调安全风险并提醒读者谨慎使用。有些网站的CA证书没有经过受信任的根证书颁发机构的认证，导致在使用浏览器上访问时会出现类似于12306网站的SSL错误提示。这在某些情况下可能会用到，但需要注意可能存在安全风险。请谨慎使用该参数，并确保你在访问的网站是可信的。参数的作用，确保读者理解该参数的用途。库发送请求时，如果访问的网站存在类似问题，会抛出包含。

2023-08-07 13:30:39 1141 1

原创 requests模块-代理proxies使用

反向代理不为浏览器或客户端转发请求，而是为最终处理请求的服务器转发请求。客户端不知道服务器的真实地址，请求发送给反向代理服务器，然后由反向代理服务器转发给最终处理请求的服务器，例如nginx。

2023-08-07 13:27:52 4187

原创 requests模块-timeout参数

通过设置合理的超时时间，我们可以避免长时间的等待，提高应用的性能和用户体验。合理设置超时时间可以避免长时间等待，提高应用性能和用户体验，使整个爬虫项目更加高效稳定。在学习爬虫和request模块的过程中，掌握超时参数的使用方法对于开发者来说十分重要。通过灵活调整超时参数，我们可以优化网络请求，确保在各种情况下都能正常处理请求。在进行网上冲浪或爬虫项目开发时，我们常常会遇到网络波动和请求处理时间过长的情况。表示在发送请求后，最多等待3秒钟内返回响应，如果在规定的时间内没有得到响应，就会抛出超时异常。

2023-08-07 13:25:21 1872

原创 requests模块-cookiejar对象的处理

在爬虫项目中，通过这种转换方法，我们可以方便地处理Cookie信息，使得爬取和模拟登录等操作更加灵活和高效。同时，理解这一细节有助于深入理解。类型的对象，其中包含了对方服务器设置在本地的Cookie信息。库的使用，以及在爬虫开发中处理Cookie相关的知识点。对象时，我们可以通过。

2023-08-07 13:22:32 1452

原创 requests模块-cookies参数的使用

此外，由于Cookie存储在用户的浏览器中，可能会受到黑客的攻击和利用。通过这个Cookie，服务器能够认出你是之前的访问者，并根据你的个人喜好或登录状态来提供个性化的服务，比如显示你之前浏览过的商品、保持你的登录状态等。当你访问一个网站时，服务器会在你的浏览器中创建一个Cookie，其中包含了一些重要的信息，如你在网站上的活动记录、登录状态等。在打印的输出结果中搜索title，html中的标题文本内容如果是你的github账号，则成功利用headers参数携带cookie，获取登陆后才能访问的页面。

2023-08-07 13:20:17 3464 1

原创爬取每日一文

在本教程中，我们将使用 Python 爬虫技术从每日一文网站爬取文章，并将其保存到 Word 文档中。

2023-07-18 14:38:51 386

原创爬取百度热搜榜

本教程将介绍如何使用Python编写爬虫代码来获取百度热搜榜的实时数据。我们将使用requests模块发送HTTP请求，并使用模块解析HTML内容。

2023-07-18 12:18:47 2060 4

原创 requests模块-发送带参数的请求

它确保URL的完整性和可传输性，因为某些字符在URL中具有特殊含义，可能会引起解析错误或干扰URL的结构。参数会作为请求体的一部分进行发送。都是搜索关键词的参数名称，只要保持URL中的参数名正确，百度搜索服务器就可以正确解析搜索关键词并返回相应的搜索结果。参数替换成其他名称，但需要确保在构建URL时，参数名称要与百度搜索服务器接受的参数名称一致。这两种方式的结果应该是相同的，都会发送一个带有指定头部和参数的GET请求到百度搜索页面。返回的URL地址中的百分号（%）符号是经过URL编码的结果，而不是加密。

2023-07-18 11:53:27 1480

原创 requests模块-发送带请求头的请求

Header是HTTP请求和响应中的元数据信息，用于在请求中传递附加的参数和配置。注意：Header字段名称不区分大小写。使用不同的Header字段，可以在HTTP请求中传递不同的信息，实现更灵活和个性化的请求和响应过程。但要注意，使用header时需遵循相关的HTTP规范，并确保数据的安全性和合法性。

2023-07-18 11:48:54 1335

原创 requests模块-响应对象的常用属性和方法

在使用 Requests 发送请求后，会得到一个 Response 响应对象。除了常用的text和content属性之外，Response 对象还提供了许多其他常用的属性和方法。

2023-07-16 20:09:33 710

原创 requests模块-响应对象的text与content之间的区别

方法时，如果该响应的头部没有指定编码方式，requests库会自动推测出响应的编码方式，然后将响应内容以Unicode格式返回。但需要注意的是，由于requests库是基于chardet模块进行编码推测的，因此存在一定的误判可能性。如果需要将其解码成字符串形式，需要使用bytes对象的decode()方法来指定正确的编码方式，例如。方法返回的是二进制格式的数据，适用于处理图片、音频、视频等多媒体文件。此外，需要特别注意的是，如果响应内容为二进制数据而非文本数据，使用。方法适合处理文本信息，使用。

2023-07-16 20:06:58 523

原创 requests模块-get请求

使用 Requests 向简书发送 GET 请求。

2023-07-16 20:04:24 928

原创 requests模块-简介-安装-基本使用

Requests是一个用 Python 编写的 HTTP 库，它建立在 Python 的标准库urllib的基础上。该库旨在简化与 HTTP 通信相关的任务，使开发人员能够轻松地发送 HTTP 请求，并处理服务器响应。它采用 Apache2 Licensed 开源协议，这意味着你可以在商业项目中免费使用它，同时还能自由地修改和分发代码。

2023-07-16 19:13:33 1243

原创 HTTP报文详解

HTTP通信由两部分组成: 客户端请求消息与服务端响应消息当我们在浏览器输入URL https://www.baidu.com 的时候，浏览器发送一个Request请求去获取 https://www.baidu.com 的html文件，服务器把Response文件对象发送回浏览器。浏览器分析Response中的 HTML，发现其中引用了很多其他文件，比如Images文件，CSS文件，JS文件。浏览器会自动再次发送Request去获取图片、CSS文件，或者JS文件。

2023-07-16 14:01:22 1442

原创浏览器运行过程

浏览器渲染出来的页面和爬虫请求的页面很多时候并不一样，是因为爬虫不具备渲染的能力（当然在后续学习中会借助其它工具或包来帮助爬虫对响应内容进行渲染）但是在爬虫中，爬虫只会请求url地址，对应的拿到url地址对应的响应（该响应的内容可以是html，css，js，图片等）

2023-07-13 21:41:58 158

原创 HTTP响应状态码---小白指南

HTTP（Hypertext Transfer Protocol）是用于在客户端和服务器之间传输信息的协议。在使用HTTP进行通信时，服务器通过HTTP响应状态码向客户端提供关于请求处理结果的信息。状态码是三位数字，用于表示不同的处理结果和行为。本文将介绍常见的HTTP响应状态码，并按照类别进行分类。

2023-07-13 21:37:24 174

原创 HTTP和HTTPS的概念和区别

HTTP（超文本传输协议）和HTTPS（带有安全套接字层的超文本传输协议）是用于在客户端和服务器之间传输数据的协议。它们在安全性、性能和使用方式等方面存在显著差异。

2023-07-13 21:34:52 274

原创 Python爬虫学前准备

专业术语：网络爬虫（又被称为网页蜘蛛，网络机器人）网络爬虫是一种按照一定规则自动抓取互联网信息的程序或脚本，也被称为网页蜘蛛、网络机器人、网页追逐者等。随着大数据时代的来临，爬虫在互联网中的地位越来越重要，可以高效地获取我们感兴趣的信息。网页爬取是指通过网络爬虫技术从目标网站上抓取所需的数据，并进行必要的数据清洗和处理。网页爬取可以帮助我们更加高效地获取我们所需要的数据，从而提高工作效率。合法使用：使用爬虫技术要遵循相关法律和规定，不要进行违法、非法活动。尊重 robots.txt 协议。

2023-06-28 18:18:24 779 1

原创 selenium获取元素信息常用方法

本文介绍了使用 Selenium 获取网页元素信息的常用方法，包括获取元素大小、文本内容、属性值、判断元素是否可见、可用、选中等。同时还介绍了获取当前页面 URL 和 Title 的方法。这些方法对于 Web 应用程序测试和页面分析非常有用。

2023-06-07 18:54:24 9281 4

原创 Python 九九乘法表的7种实现方式

九九乘法表是初学者学习编程的必要练手题目之一，因此各种语言都有对应的实现方式，而 Python 也不例外。在 Python 中，我们可以使用多种方式来生成一个简单的九九乘法表。

2023-06-05 15:34:16 34534

原创 2023年度Linux安装与移除tomcat保姆级教程

Tomcat是一个流行的Java Servlet容器，用于开发和部署Java Web应用程序。本文将介绍如何在CentOS操作系统上安装与移除Tomcat，并提供了逐步说明以及相关命令。读者需要具备一定的Linux基础知识，如使用命令行工具等。

2023-05-29 13:51:58 2940

原创 2023年度Linux系统安装与移除JDK保姆级教程

本篇文章介绍了如何在 CentOS 系统上安装与移除JDK，并提供了两种不同的安装与移除方法。我们还将针对每种方法的优点和缺点进行对比

2023-05-28 14:51:04 1456

原创 Linux 用户组的管理-增加一个新的用户组

Linux用户组的管理是系统管理员必须掌握的技能之一。本文将向您介绍如何增加一个新的用户组，让您更好地理解Linux用户组的使用方法。无论您是Linux初学者还是进阶用户，都可以通过本文来了解这一技能，并进一步提升您的技能水平。让我们开始学习吧！

2023-05-24 20:01:43 4133

原创 Linux 用户组的管理-用户组之间切换的技术

Linux用户组的切换技术是Linux系统管理员必不可少的技能之一。本文将向您介绍如何在不同的用户组之间进行切换。无论您是刚入门的初学者还是进阶的用户，都可以通过本文了解这一技能，并更好地掌握Linux用户组管理的使用方法。让我们一起来学习吧！

2023-05-24 19:56:16 1634

原创 Linux 用户组的管理-修改用户组的属性

Linux用户组的管理是任何系统管理员都需要掌握的技能。本文将介绍如何修改用户组的属性，以帮助您更好地理解Linux用户组的使用方法。无论您是刚入门的初学者还是进阶的用户，都可以通过本文来提升您的技能。让我们开始学习吧！

2023-05-24 19:52:56 1230

原创 Linux 用户组的管理-删除一个已有的用户组

Linux的用户组管理是系统管理员必备技能之一。本文将向您介绍如何删除已有的用户组，让您更好地掌握Linux用户组的使用方法。无论您是Linux初学者还是进阶用户，都可以通过本文轻松入门。

2023-05-24 19:50:47 3248

原创 Linux 用户账号管理-用户间切换

在Linux系统中，你可以通过用户间切换来访问其他用户的文件和应用程序，方便多用户共享同一设备。本文将向你介绍如何在Linux系统中进行用户间切换，是Linux初学者必备的基础知识哦！

2023-05-21 12:13:23 6674

空空如也

空空如也