使用scrapy做爬虫遇到的一些坑：No module named items以及一些解决方案

最新推荐文章于 2025-07-01 13:04:58 发布

原创最新推荐文章于 2025-07-01 13:04:58 发布 · 2.7w 阅读

21 ·

CC 4.0 BY-SA版权

文章标签：

#scrapy #python #web #爬虫

学习python我所遇到的坑以及解决方法同时被 2 个专栏收录

53 篇文章

订阅专栏

scrapy学习笔记

12 篇文章

订阅专栏

本文记录了使用Scrapy进行小说网站爬取的过程，包括解决模块导入错误的具体步骤及经验总结。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在学习scrapy，因为官方文档看着比较累，所以看着崔庆才老师写的博客来做：https://cuiqingcai.com/3472.html

# -*- coding: utf-8 -*-
import re
import scrapy  # 导入scrapy包
from bs4 import BeautifulSoup
from scrapy.http import Request  ##一个单独的request的模块，需要跟进URL的时候，需要用它
from dingdian.items import DingdianItem  ##这是我定义的需要保存的字段，（导入dingdian项目中，items文件中的DingdianItem类）

class Myspider(scrapy.Spider):
    name = 'dingdian'
    allowed_domains = ['23wx.com']
    bash_url = 'http://www.23wx.com/class/'
    bashurl = '.html'

    def start_requests(self):
        for i in range(1, 11):
            url = self.bash_url + str(i) + '_1' + self.bashurl
            yield Request(url, self.parse)
        yield Request('http://www.23wx.com/quanben/1', self.parse)

    def parse(self, response):
        print(response.text)

然后在编译时总会出现No module named items这个问题，找了很久都不知道哪里出错。

于是一开始就按照崔老师的做法

还是一样出错原因，于是就搜索了许多可能错误的原因，一步步纠正，最后才明白问题所在。在这里提供一些可能出错的原因：

1.爬虫名字和项目名字一样，导致导入模块时出错：改爬虫或者项目名称

2.模块不存在：检查你的项目中的items，看看有没有出错

3.模块没有保存：在编辑好items模块时，记得运行编译

4.模块名字和引入的不一样：自行检查

5.手动添加自己创建的scrapy文件夹的路径：例如sys.path.append(r"C:\Users\ME\Desktop\Python project\爬虫\scrapy\novel")。注意路径前“”的r

import sys 
sys.path.append（文件路径）

6.（先挖坑，后续再添加）