scrapy----将数据保存到MySQL数据库中

本文介绍如何在Scrapy项目中实现自定义的MySQL Pipeline来存储爬取的数据。通过示例代码展示了如何建立数据库连接、执行插入操作并提交事务。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.在pipelines.py中自定义自己的pipeline

import pymysql
class PymysqlPipeline(object):
    def __init__(self):
        # 连接数据库
        self.connect = pymysql.connect(
            host='localhost',
            db='bole',
            user='root',
            passwd='123456',
            charset='utf8',
            port=330,
            use_unicode=True)
        self.cursor = self.connect.cursor()

    def process_item(self, item, spider):
        cursor = self.cursor
        sql = 'insert into bole(title, datetime, category, content, dianzanshu, shoucanshu, pinglunshu) values (%s,%s,%s,%s,%s,%s,%s)'
        cursor.execute(sql, (
            item['title'], item['datetime'], item['category'], item['content'], item['dianzanshu'],
            item['shoucanshu'],
            item['pinglunshu']))
        self.connect.commit()

        return item

2.在settings中开启自己的pipeline

ITEM_PIPELINES = {
   'Bole.pipelines.PymysqlPipeline': 1,
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值