需求: 将爬虫获取的HTML页面源码原样保存到mysql数据库中,前段需要调用HTML页面原样展示
问题: HTML代码中有很多反斜杠 \ 符号,导致pymysql或者MySQLdb报错。 不能使用replace将报错字符替换。
解决方法:使用pymysql或者mysqlDb 提供的内置方法scape_string()
例如: row_html="\img\test.jpg" 里面包含反斜杠,并且 \t 亦为转义符
| 转义序列 | 字符 |
|---|---|
| \b | 退格 |
| \f | 走纸换页 |
| \n | 换行 |
| \r | 回车 |
| \t | 横向跳格 (Ctrl-I) |
| \' | 单引号 |
| \" | 双引号 |
| \\ | 反斜杠 |
此时可以使用pymysql或者MySQLdb提供的内置方法解决。
用法:python中有
row_html=pymysql.escape_string(row_html)
row_html=MySQLdb.escape_string(row_html)
PHP中有mysql_real_escape_string
java中在上述要求的前提下,哪位大神有好的方法也可以讨论一下
本文解决HTML代码中反斜杠导致pymysql或MySQLdb插入MySQL数据库的问题,介绍使用pymysql或MySQLdb提供的escape_string()方法正确处理转义字符。
637

被折叠的 条评论
为什么被折叠?



