
Python网路爬虫-从入门到精通实战
文章平均质量分 93
程序小勇
本人热爱专研IT技术,广泛且深入学习研究前后端开发、机器学习和深度学习算法,是一名全栈优秀开发高级工程师,曾在华为总部工作3年,负责IT研发,积累丰富开发技术经验。欢迎关注,一起交流学习进步哦,更多精彩等你!
展开
-
Python网络爬虫-WebSocket数据抓取
WebSocket是一种在单个TCP连接上进行全双工通信的网络协议。与HTTP不同,WebSocket提供了持久连接,允许服务器和客户端在同一时间内互相发送数据。这种特性使得WebSocket非常适合实时通信,如聊天应用、在线游戏等。握手过程客户端发送一个HTTP请求到服务器,请求的头部包含特定的WebSocket协议信息。服务器接收到请求后,如果支持WebSocket协议,会返回一个HTTP 101状态码,表示协议切换成功。握手成功后,TCP连接就被升级为WebSocket连接。数据帧。原创 2024-04-24 12:19:00 · 3535 阅读 · 41 评论 -
Python网络爬虫-re正则匹配数据
re是一种强大的文本处理工具,它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。正则表达式是由普通字符(例如字符 a 到 z)以及特殊字符(称为“元字符”)组成的文字模式。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。例如,在Python中,可以使用re模块来使用正则表达式。正则表达式的主要应用包括:数据验证、搜索和替换操作等。原创 2024-04-24 11:21:50 · 2196 阅读 · 6 评论