目标:获取海量表情包,存入数据库,然后搭建简单网站通过输入关键字获取对应的的表情包
这里我们的首先要爬取表情包的网站是这个网站:
http://www.doutula.com/photo/list/?page=0
我们先来分析一下这个网页的源代码:
源码里面可以发现我们需要的内容然后去用正则表达式获取,然后存入数据库
同时在源码最上面可以看见网页是utf-8编码的。
============================================================
注意,这里我们先说下navicat for MySQL:关于软件下载和MySQL安装之前博客说过了。
先是新建一个叫doutula的数据库
=============================================
然后在该数据库中新建一个表
===========================================
然后再在表中添加相应的id和name和imageUrl

本文介绍了如何使用Python爬虫从特定网站抓取海量表情包,将数据存储到MySQL数据库,并创建一个简单的网站,用户可以通过输入关键字查询表情包。详细过程包括网页分析、数据库设计、权限设置以及网站代码实现。
最低0.47元/天 解锁文章
92





