html的%3c转码,将抓取后的网页转码解决方案

将抓取后的网页转码

用spider抓取网页后,存入数据库,但抓取的网页是乱码,怎么解决????

------最佳解决方案--------------------

得到的数据用

URLEncoder.encode(str,"UTF-8") 试试呗

------其他解决方案--------------------

试一下在存入数据库前转码

------其他解决方案--------------------

引用:得到的数据用

URLEncoder.encode(str,"UTF-8") 试试呗

你说的方法都试过,乱码是没了,但是整个页面都变成下面这样了。

%3C%21DOCTYPE+html+PUBLIC+%22-%2F%2FW3C%2F%2FDTD+XHTML+1.0+Transitional%2F%2FEN%22+%22http%3A%2F%2Fwww.w3.org%2FTR%2Fxhtml1%2FDTD%2Fxhtml1-transitional.dtd%22%3E%0A%3C%21--%5B704%2C2%2C184889%5D+published+at+2012-10-19+11%3A29%3A43+from+%23182+by+7118--%3E%0A%0A%3C%21--+LLTJ_MT%3Aname+%3D%22%3F%3F%3F%A7%DB%3F%3F%3F%3F%3F%3F%A6%B1%3F%22+--%3E%0D%0A%3C%21--+LLTJ_ZT%3Aurl%3D%22http%3A%2F%2Ftravel.sina.com.cn%2Fz%2FChinaNationalTravel%2Findex.shtml%22%3B+name%3D%22%3F%3F%3F%A7%DB%3F%3F%3F%3F%3F%3F%A6%B1%3F%2CChina+National+Travel%22%3Btype%3D%22ZW%22%3B+--%3E%0D%0A%0A%3Chtml+xmlns%3D%22http%3A%2F%2Fwww.w3.org%2F1999%2Fxhtml%22%3E%0D%0A%3Chead%3E%0D%0A%3Cmeta+http-equ.........

------其他解决方案--------------------

引用:引用:得到的数据用

URLEncoder.encode(str,"UTF-8") 试试呗

你说的方法都试过,乱码是没了,但是整个页面都变成下面这样了。

Java code?12%3C%21DOCTYPE+html+PUBLIC+%22-%2F%2FW3C%2F%2FDTD+XHTML+1.0+Transitional%2F%……

括号之类的都没转换过来。。

------其他解决方案--------------------

....转成GBK呢?  然后看看数据库的编码

------其他解决方案--------------------

引用:....转成GBK呢?  然后看看数据库的编码

都试过,数据库存的是2进制编码,初步怀疑是因为接口调用的时候编码不是utf-8所导致的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值