python爬去豆瓣网热映电影全部信息以及其海报

豆瓣热映电影信息抓取

#!/usr/bin/env python

-- coding: utf-8 --

@Time : 2019/6/22 20:59

@Author : LJ

@Site :

@File : db_playing_movie.py

@Software: PyCharm

‘’’
这篇主要是获取豆瓣网正在热映电影网的电影全部信息
‘’’
import re
import requests
from requests import RequestException
from demo01.util import buid_proxy
from urllib.parse import urlencode
from lxml import etree
import json
import time
import codecs
import os
proxies=buid_proxy()
headers={
“User-Agent”:“Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36”,
“Referer”:“https://movie.douban.com/
#构造请求头是伪造成成浏览器,在有的反爬虫网站这个时候可以添加Cookie,Connection是非常有必要的
}

#第一步,获取豆瓣网的电影信息
def get_one_page(url):
res=requests.get(url,proxies=proxies,headers=headers)
if res.status_code==200:
html=res.text
return html
return None

def parse_one_page(html):
content=etree.HTML(str(html))
data=content.xpath(’//div[@id=“nowplaying”]/div[2]/ul/li’)
i=0
#获取这页所有电影的信息,在这里我们需要的有四个信息,但是能用的是三个
for items in data:
#print(items)
movie_info=[]
while i <len(data)-1:
movie_id=items.xpath(’//li/@id’)[i]
movie_name=items.xpath(’//li/@data-title’)[i]
movie_detail_url=items.xpath(’//li/ul/li[1]/a/@href’)[i]
movie_img_url=items.xpa

1:本电影系统使用的是包月计费方式,会员可以分为电影游客、普通会员、白银会员和黄金会员, 黄金会员可无任何限制下载电影,普通会员一天只能下载4集电影,白银会员一天只能下载8集电影, 会员只要一次付12个月就可以自动成为黄金会员,(增加一个月高额黄金会员、两年黄金会员) (增加永久钻石会员)。电影可以分为(新增免费电影)普通电影和黄金电影, 黄金电影只有黄金会员才可以下载。 2:本电影系统有批量生成充值卡功能,用户得到卡号和密码就可以往自己的帐号充值, 可以生成各种不同的卡,充值卡可以拿到各个网吧代售 3:本电影系统有多种支付方式:邮局汇款、银行汇款、在线支付、手机支付。 4:会员到期系统自动封号 5:电影系统可以实现在线播放与下载功能。 6:在线播放采用双重加密方法,保证影片地址不被泄漏。 7:可以设定多个服务器地址,影片地址可随时批量修改。 8:有强大的会员续费功能,管理方便,只需要按按钮就可以实现会员开通、续费、删除。 9:有在线发邮件功能,可随时通知道会员 10:本电影系统可实现电影网站服务器与影片存放服务器分离 11:可以一次增加无数集电影。 12:内置图片上传功能 13:支持多服务器 14:可以查看用户是否在线,可以将用户踢出网站。 15:可以支持在线支付,(可以自动开通会员帐号)内置1st-pay在线支付功能,用户只需在后台设置好1st-pay的用户名及返回URL即可使用,无需修改程序。支付成功返回的URL是user/puyok.asp 后台地址:http://你的域名/admin/login.asp 管理账号:admin/admin。 16:增加会员报告影片错误功能。 17:程序会自动跟据会员付多少钱而给会员定相应的级别和相应的观看时间,会员到期程序自动封锁帐号。 18:数据库采用特殊制作,不通过FTP从服务器下载的数据库是无法使用的。 19:电影可以设置为免费电影、普通电影、黄金电影。 20:增加演员搜索 21:增加IP限制,被限制的ip将无法访问 22:增加了网站投票功能
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值