python爬虫

import re
import urllib.request
import ssl
def gethtml(url):
    header={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36 Edge/17.17134'}
    request=urllib.request.Request(url,headers=header)
    response=urllib.request.urlopen(request)
    data=response.read().decode("utf-8")
    return data
def gettitle(hh):
    gh={}
    html=hh
    patter=re.compile('<span style="font-size:13px;">(.*?)</span>',re.S)

    scan=re.findall(patter,html)
    patter1=re.compile('<span class="rating_nums">(.*?)</span>',re.S)
    scan1=re.findall(patter1,html)
    patter2=re.compile('<span class="pl">(.*?)</span>',re.S)
    scan2=re.findall(patter2,html)
    i = 0
    j = 0
    for x in scan:
        gh[x]="   "+scan1[i]+"  "+scan2[j]
        i+=1
        j+=1
    return gh
ssl._create_default_https_context = ssl._create_unverified_context
url="https://movie.douban.com/chart"
hh=gethtml(url)
html=gettitle(hh)
print("电影名称","   评分","   人数")
for x in html:
    print(x,   html[x])
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值