爬取豆瓣电影正在上映的电影,将爬取下的内容保存到mysql中

这篇实战教程介绍了如何运用XPath解析技术抓取豆瓣电影网站上的正在上映电影信息,并详细讲解了如何将获取的数据存储到MySQL数据库中,以提升对XPath和数据库操作的实践能力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本实战主要是为了进一步熟悉xpath的使用,再者就是将数据保存到Mysql数据库中,学习使用Mysql.

import pymysql
import requests
from lxml import etree
#创建数据库
def connectDB():
#在此处我的数据库密码password为空,如果用到此代码需要将password设置为自己的密码
    db  = pymysql.connect(host = 'localhost',user = 'root',password = None, port = 3306)
    cursor = db.cursor()
    cursor.execute("CREATE DATABASE newmovie DEFAULT CHARACTER SET utf8")
    db.close()
#创建表
def createTable():
    createTableSql = 'CREATE TABLE IF NOT EXISTS newmovies (title VARCHAR(255)NOT NULL ,src VARCHAR(255)NOT NULL ,score DECIMAL NOT NULL)'
    db = pymysql.connect(host = 'localhost',user = 'root',password = None, port = 3306,db = 'newmovie')
    cursor_create = db.cursor()
    cursor_create.execute(createTableSql)
    db.close()
    print('create table' + 'newmovie' + 'successfully')
def crawl_html():
   
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值