用mechanize从google获取到我的书签列表的XML文件.http://www.google.com/bookmarks/?output=xml&num=10000
发现中文字符都表示成了转义字符,形如㹅 这种转义字符使你的文档编码为任何一种,都能在网页中正常显示转义字符所代表的字符串.
现要将这种转义字符串全部还原成其代表的字符串,然后保存起来存到数据库里
发现中文字符都表示成了转义字符,形如㹅 这种转义字符使你的文档编码为任何一种,都能在网页中正常显示转义字符所代表的字符串.
现要将这种转义字符串全部还原成其代表的字符串,然后保存起来存到数据库里
def decodeESC( string )
string.gsub(/&#x(.{4,4});/){ [("0x"+$1).to_i(16)].pack("U") }
end