情景再现:
从网站爬取技术文章,文章内容、标签、样式包含各种单引号双引号,入数据库失败。
代码如下:
报错如下:
解决办法:
入库前对入库的值进行转义,可使用php系统函数addslashes()。
代码如下:
结果如下:
github地址:
本文介绍了一种常见的爬虫技术问题:从网站获取的文章内容因包含特殊字符导致无法正常存入数据库的情况,并提供了解决方案——使用PHP的addslashes()函数对数据进行转义处理。
情景再现:
从网站爬取技术文章,文章内容、标签、样式包含各种单引号双引号,入数据库失败。
代码如下:
报错如下:
解决办法:
入库前对入库的值进行转义,可使用php系统函数addslashes()。
代码如下:
结果如下:
github地址:
372
6644

被折叠的 条评论
为什么被折叠?