正则表达式匹配百度热搜

#python
import urllib.request,re
with urllib.request.urlopen('https://top.baidu.com/') as file:
    print("网页状态:",file.status,file.reason)
    data = file.read().decode('utf-8')

    reg = '<title>(.*?)</title>'
    title = re.findall(reg,data,re.S|re.M)
    print("title:",title)
    #热搜
    reg = '<div class="c-single-text-ellipsis">(.*?)</div>'
    content = re.findall(reg, data, re.S | re.M)
    i=0
    print("热搜:\n")
    while i<20:
        print(content[i])
        i=i+2
    #榜单名
    reg = '<span class="title_jDbBV c-theme-color">(.*?)</span>'
    榜单名 = re.findall(reg, data, re.S | re.M)
    print("榜单名:\n", 榜单名)
    #游戏排行榜
    reg = 'rsv_dl=fyb_hp_game" class="c-single-text-ellipsis name_3SMKh" target="_blank">(.*?)</a>'
    游戏排行榜 = re.findall(reg, data, re.S | re.M)
    print("游戏排行榜:\n", 游戏排行榜)
    #汽车排行榜
    reg = 'rsv_dl=fyb_hp_car" class="c-single-text-ellipsis name_3SMKh" target="_blank">(.*?)</a>'
    汽车 = re.findall(reg, data, re.S | re.M)
    print("汽车排行榜:\n", 汽车)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值