
网页处理
coolzen
这个作者很懒,什么都没留下…
展开
-
python,使用requests,BeautifulSoup读取HTML中文发生乱码
发生读取HTML页面中文乱码# 简洁地处理HTML文件import bs4import requestsimport logging,sysprint(sys.getfilesystemencoding())#print('Html is encoding by : %',chardet.detect(GetHtml(url)))logging.basicConfig(l...原创 2018-09-15 17:48:01 · 1896 阅读 · 0 评论 -
低级错误,vscode 开启上级文件夹导致使用相对路径运行错误 FileNotFoundError: [Errno 2] No such file or directory
正常的文件突然不能运行了,百度了半天也没找到问题。结果是打开了上级文件夹。。。原创 2018-09-17 16:23:49 · 5083 阅读 · 2 评论 -
selenium python 打开新的标签页
from selenium import webdriverfrom selenium.webdriver.common.keys import Keys#phantomjs 需要改动下 driver = webdriver.Firefox()driver.get("http://login.taobao.com")#windows 用Keys.CONTROL 如同ctrl+tdri...转载 2018-09-28 20:48:18 · 12696 阅读 · 0 评论 -
Python解决unicode编码,如\xe9\x9d\x92\xe8\x9b\x99\xe7\x8e\x8b\xe5\xad\x90转中文
在这个:https://blog.youkuaiyun.com/baidu_19473529/article/details/54949453里的方法: s = '\xe9\x9d\x92\xe8\x9b\x99\xe7\x8e\x8b\xe5\xad\x90' ss = s.encode('raw_unicode_escape') print(ss) # 结果:b'\xe9...原创 2018-10-23 12:44:59 · 35758 阅读 · 0 评论