- 博客(12)
- 收藏
- 关注
原创 Git 使用教程
Git 是目前最流行的分布式版本控制系统,用于高效管理代码版本它适用于团队协作,也非常适合个人项目的版本管理核心功能:版本控制、分支管理、协作开发与SVN的区别: Git 是分布式的,而 SVN 是集中式的。
2025-01-02 09:06:42
253
原创 Web 开发必备知识点:HTML、CSS、JavaScript、Vue
以上内容是前端开发的核心知识点,可以作为学习和复习的指南。如果想更直观地理解,可以将这些内容制成思维导图,帮助梳理知识体系。
2024-11-18 21:58:58
652
2
原创 使用Python爬取Boss直聘的招聘数据并进行数据分析
本次项目更加熟悉如何使用Python和Selenium抓取Boss直聘的岗位信息,并将数据存储到CSV文件中。本次项目的核心在于多线程的实现以及数据存储的去重处理。
2024-11-06 14:01:33
1867
1
原创 使用Python下载B站视频并合并音频:一个实用的应用实例
PySide生成的界面和按钮以自己的为准logging.info("初始化完成"): 定义一个主界面类mainUi,继承自,用于构建用户界面。: 构造函数,初始化界面并设置事件处理。: 设置界面元素。: 连接按钮点击事件,触发getRequest方法。: 定义HTTP请求头,使用生成随机User-Agent。: 用于存储抓取到的URL。logging.info("初始化完成"): 记录初始化完成的日志信息。配置日志记录的级别为INFO,并设置日志信息的格式,包括时间戳、日志级别和日志消息。
2024-10-16 00:08:33
762
原创 基于 Selenium 和 Pandas 的大麦网爬虫项目
本项目通过使用Selenium和Pandas库来实现对大麦网演出信息的自动爬取,并将数据保存为CSV文件。爬虫能够抓取演出信息如图片地址、演出标题、演出地址、时间、售票价格及售票状态。多线程技术用于提高爬取效率,日志记录用于监控程序运行状态。
2024-09-24 01:01:16
2548
原创 使用 Python 爬取 优快云 热门博客数据,采用抓包的方式爬取动态数据
unique_df = combined_df.drop_duplicates(subset=['标题'], keep='first')else:print(f"数据已保存到data{num}.csv文件中"): 将数据转换为 DataFrame 格式,以便进行操作和保存: 检查 CSV 文件是否已存在: 如果文件存在,读取现有数据: 将现有数据与新数据合并unique_df = combined_df.drop_duplicates(subset=['标题'], keep='first')
2024-09-18 22:19:52
1928
原创 爬虫爬取中国各个学科排名前五的学校内容案例的实现过程
通过本项目的练习,您可以掌握以下几个知识点:如何使用requests库进行网页请求和数据获取。如何使用lxml库进行HTML解析。如何使用pandas进行数据处理和保存。希望这篇文章对您有所帮助,如果您有任何问题或建议,欢迎在评论区留言讨论!
2024-09-09 21:15:49
839
原创 Python 音频处理与聊天机器人应用项目实现
基于python语言开发,通过聊天机器人接口(Coze API)接收问题并生成回答,使用百度智能云实现语音功能,用pyside6实现GUI界面等
2024-09-03 21:14:54
695
原创 使用Python实现凯撒密码加密与解密
凯撒密码的加密与解密过程虽然实现比较简单,但可以有效的防止密码被轻易盗用,盗取密码的人不知道你向前或者向后移动的位数,就无法知道你的原密码,有一定的安全性.可以使用凯撒密码来保存密码等操作。凯撒密码是一种经典的加密算法,通过将字母表中的每个字母向后(或向前)移动固定的位数来加密消息。这种方法虽然简单,但却是密码学中重要的基础。凯撒密码的工作原理。可以使用公式进行说明,例如:对于一个字母,使用公式。
2024-08-25 22:14:30
3712
原创 TCP客户端,服务端信息传递以及服务端与多客户端信息传递
2.使用多线程来处理多个客户端的连接。每当一个新的客户端连接到服务器时,创建一个新的线程来专门处理该客户端的通信。4.服务端需要有逻辑来处理不同客户端发送的信息,如广播信息给所有客户端,或实现某种业务逻辑。5.客户端通过TCP连接到服务器,并在连接建立后可以进行数据的发送和接收。5.处理客户端发送的数据(recv),并可以选择回复数据(send)6.客户端应处理来自服务端的数据,并根据协议进行相应的操作。1.服务器需要监听客户端连接请求,并接受这些连接。4.接受来自客户端的连接请求(accept)
2024-08-18 18:59:11
501
原创 常用的 Python 模块及其常见使用方法
模块提供了与 Python 解释器交互的功能,如访问命令行参数、退出程序等。模块提供了与操作系统交互的功能,如文件操作、目录操作、环境变量等。模块提供了生成随机数、随机选择等功能。模块用于解析和生成 JSON 数据。模块提供了处理日期和时间的功能。
2024-08-11 17:25:33
239
原创 Python部分常见的算法及其优缺点
如果比目标值小,将right = mid - 1,则在左边的元素中继续查找,直到找到目标值为止。如果比目标值大,将left = mid + 1,在右边的元素中继续查找,直到找到目标值为止。排序过程中空间复杂度较低,通常为 O(log n),因为它是原地排序算法。时间复杂度为 O(log n),适用于有序数组的高效查找。每次循环都找索引在中间的元素,将该元素与目标值进行比较。如果等于目标值,则之间返回该元素索引,结束循环。如果当前元素的值较大时,则交换他们的位置。小于基准的元素和大于基准的元素。
2024-08-03 19:27:35
367
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人