不知道为啥突然碰到一个页面etree xpath获取到的中文是乱码。最后靠加HTMLParser参数搞定。代码如下
@staticmethod
def getXpath(xpath, content):
hparser = etree.HTMLParser(encoding='utf-8')
tree = etree.HTML(content,hparser)
out =
不知道为啥突然碰到一个页面etree xpath获取到的中文是乱码。最后靠加HTMLParser参数搞定。代码如下
@staticmethod
def getXpath(xpath, content):
hparser = etree.HTMLParser(encoding='utf-8')
tree = etree.HTML(content,hparser)
out =
1937
796
4636
599
1883

被折叠的 条评论
为什么被折叠?