Python 抓取动态网页 新法

本文介绍了一种使用Win32extsforPython抓取动态网页的方法,该方法仅需安装一个库,相比Selenium或dryscrape更为简便。通过示例代码展示了如何抓取QQ主页,支持Trident、Webkit/Blink渲染引擎。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

Python 抓取动态网页 一般使用 Selenium 或者 dryscrape,但安装比较复杂,依赖库较多。

这里介绍使用 Win32exts for Python 抓取动态网页。首先项目地址:

            https://github.com/tankaishuai/win32exts_for_Python

确保安装 32位版本的Python (2.x 或 3.x 均可), 选择 32位的 win32exts.pyd 库放于 /DLLs 目录下。

仅有此一个文件即可。

抓取 QQ主页的示例代码如下:

 

#
# 抓取动态网页示例
#
url = "http://www.qq.com"

import win32exts
win32exts.load_sym("*", "*")

pText = win32exts.SysTextByBrowser(win32exts.L(url), 10, 3, None)
strText = "err"
if pText != 0:
    strText = win32exts.read_wstring(pText, 0, -1)
    win32exts.free(pText)
print (strText)

 

默认使用Trident渲染引擎,同时也支持 Webkit / Blink 渲染引擎。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值