在学习爬虫时,需要将爬到的数据导入到数据库中,通过自增长给数据编号,这是我创建的表
create table news(id int(3)primary key auto_increment,newsurl varchar(50) ,title varchar(50),newsfrom varchar(50),newsdate varchar(50),contents varchar(2000),newscount varchar(20));
也可以在设置初始值
create table news(id int(3)primary key auto_increment,newsurl varchar(50) ,title varchar(50),newsfrom varchar(50),newsdate varchar(50),contents varchar(2000),newscount varchar(20)) auto_increment=100;
但是如果把从数据库中删除了几条数据,id不会再次自动排序;而且如果id最大值被删除了,再次插入数据时id会在原本的最大值的基础上增长。
例如:表中原本有1~100条数据,id也是1~100,如果删除了第90~100的数据,下次再添加一条数据时,新数据的id=101,而不是100.
我们可以通过设置auto_increment的值来解决这一问题
使用 ALTER TABLE cucnews AUTO_INCREMENT=0; 重新设置自增初始值
ALTER TABLE cucnews AUTO_INCREMENT=0;
爬虫数据存储与ID自增管理
本文探讨了在爬虫项目中如何有效利用数据库存储抓取的数据,特别是通过自增长ID进行编号的方法。文章详细解释了在MySQL中创建自增长字段的过程,并解决了当数据被删除后,ID不会自动重新排序的问题,提供了ALTERTABLE命令来重新设置自增初始值。
2053

被折叠的 条评论
为什么被折叠?



