用mechanize从google获取到我的书签列表的XML文件.http://www.google.com/bookmarks/?output=xml&num=10000
发现中文字符都表示成了转义字符,形如㹅 这种转义字符使你的文档编码为任何一种,都能在网页中正常显示转义字符所代表的字符串.
现要将这种转义字符串全部还原成其代表的字符串,然后保存起来存到数据库里
发现中文字符都表示成了转义字符,形如㹅 这种转义字符使你的文档编码为任何一种,都能在网页中正常显示转义字符所代表的字符串.
现要将这种转义字符串全部还原成其代表的字符串,然后保存起来存到数据库里
def decodeESC( string )
string.gsub(/&#x(.{4,4});/){ [("0x"+$1).to_i(16)].pack("U") }
end
本文详细介绍了如何使用mechanize库从Google获取书签列表的XML文件,并通过正则表达式解码转义字符,最终将还原后的字符串保存到数据库中。
2775

被折叠的 条评论
为什么被折叠?



