Python爬虫urllib之模拟百度搜索

本文介绍了一种使用Python进行百度搜索的网页爬虫方法,通过输入搜索内容,利用urllib库实现URL编码和请求发送,获取并打印网页源代码。适合初学者了解网页爬虫的基本流程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

wd = input('输入搜索内容:')
  • 将字符串URL编码

qs = {
        'wd': wd
    }
    qs = parse.urlencode(qs)
  • 修改网页地址
url = 'http://www.baidu.com/s?'
fullurl = url + qs
  • 整个代码为
from urllib import request, parse
if __name__ == '__main__':
    url = 'http://www.baidu.com/s?'
    wd = input('输入搜索内容:')
    qs = {
        'wd': wd
    }
    qs = parse.urlencode(qs)
    print(qs)

    fullurl = url + qs
    print(fullurl)

    rsp = requests.urlopen(fullurl)
    html = rsp.text
    rsp.encodng = 'utf-8'
    print(html)
    ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值