京东图书爬虫可视化项目

本文介绍了使用Scrapy和Django构建京东图书爬虫的过程,包括项目准备、图书管理系统的创建、数据库配置和模型类定义,以及爬取图书数据的分析、数据清洗和存储到MySQL数据库的操作。通过分析京东图书页面,爬取各类图书信息,并利用Django的Admin站点进行数据管理。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、项目准备

  • 开发环境:python3
  • 开发工具:pycharm
  • 使用技术:Scrapy + Django + PyMySQL

二、图书管理系统

1.创建项目

  • 创建Django项目
django-admin startproject web_book(项目名称)
  • 创建子应用
cd web_book
python manage.py startapp book(子应用名称)
  • 注册子应用:在settings.py文件中,INSTALLED_APPS项中进行子应用注册
INSTALLED_APPS = [
    'django.contrib.admin',
    'django.contrib.auth',
    'django.contrib.contenttypes',
    'django.contrib.sessions',
    'django.contrib.messages',
    'django.contrib.staticfiles',
    # 注册子应用
    'book.apps.BookConfig',
]

2.MySQL配置

  • 1、安装myaqi驱动程序PyMySQL
pip install PyMySQL
  • 2、导入pymsql并创建实例化对象:在Django的工程同名子目录的__init__.py文件中添加如下语句。
from pymysql import install_as_MyAQLdb

install_as_MySQLdb()
  • 3、配置MySQL信息:在Django的工程同名子目录的settings.py文件中修改DATABASES配置信息
DATABASES = {
   
   
    'default': {
   
   
        'ENGINE': 'django.db.backends.mysql',
        'HOST': '127.0.0.1',  # 数据库主机
        'PORT': 3306,  # 数据库端口
        'USER': 'root',  # 数据库用户名
        'PASSWORD': '123456',  # 数据库用户密码
        'NAME': 'book'  # 数据库名字
    }
}
  • 4、登陆MySQL客户端
 mysql -u root -p
  • 5、在MySQL中创建数据库book
create database book charset=utf8;

3.创建图书模型类

  • 创建模型类:book/models.py
from django.db import models


class BookInfo(models.Model):
    # 数据存储内容:大分类、小分类、书名、作者、出版社、价格、默认图片
    category = models.CharField(max_length=50, default="大类", verbose_name="图书大类")
    small_category = models.CharField(max_length=50, default="小类", verbose_name="图书小分类")
    name = models.CharField(max_length=100, default="无", verbose_name="书名")
    author = models.CharField(max_length=50, default="无", verbose_name="作者")
    store = models.CharField(max_length=100, default="无", verbose_name="出版社")
    pub_date = models.CharField(max_length=30, null=True, verbose_name="出版时间"<
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值