- 博客(6)
- 收藏
- 关注
原创 编码问题 ISO8859-1的诸多问题
转换为utf8会出现乱码, 网上很多解决方案都不可行所以, 完全没有必要转换目的无非两种, 因为出现乱码肯定是中文问题如果想直接输出在屏幕上, 则直接r.encoding = 'gbk'gbk是Windows的默认编码方式,而且, iso8859-1是和gbk可以互相转化的, 但是, ISO8859-1不能和utf8直接转换,虽然网上说utf8和gbk可以进行互相的转化, 但是经过...
2019-08-29 21:23:39
1410
原创 编码问题
在进行转码的时候, encode 必须保证字符串是Unicode编码的格式, 如果不是, 需要先用decode转为Unicodes.decode('gb2312').encode('utf-8') #decode('字符串的原始编码').encode('要转化成的编码格式') windows下原始编码为gb2312, Linux下是ASCII注意 以上问题只在Python2 中才会...
2019-08-28 07:48:28
149
原创 正则
regex = '^b.*'意思是:^ →以b开头, .→任意字符, *→前边的字符可以重复任意多遍即: 以b开头,b后边可以是任意字符,且字符数量不限re.match(pattern,line)第一个参数是符合条件的正则表达式, 第二个参数是待查找的字符串regex = 'h$'表示以h结尾的字符串?表示非贪婪贪婪的意思就是说会一直找到最后一个符合条件的值, 而非贪婪的...
2019-08-27 12:27:51
131
原创 猫眼电影榜单前50爬取
猫眼电影榜单前50爬取import requestsimport jsonfrom lxml import etree#for n in range(0,5):def getOnepage(n): url = 'https://maoyan.com/board/4?offset={}'.format(n*10) header = {'user-agent':'Mozill...
2019-08-26 22:25:49
410
原创 编码错误的处理方法
在写入文件时遇到的编码错误问题解决方法:with open(filename,'a',encoding = 'utf-8') as f: f.write(content)只要转换一下编码就行了
2019-08-26 22:25:00
1313
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人