
文本处理
ElienC
这个作者很懒,什么都没留下…
展开
-
难记的latex语法整理
整理一些使用过的比较难记的latex语法,好记性不如烂笔头,根据使用记录慢慢补充:运算符分数: \frac {a} {b} ab\frac {a} {b}ba原创 2021-01-30 10:47:43 · 208 阅读 · 0 评论 -
python byte类型与int、str类型转换
转自:https://blog.youkuaiyun.com/u013810296/article/details/86632483个人学习收藏,侵删--------------------------------------------------------------------------------------------bytes类型解释python中的bytes类型可以类比为C中的...转载 2020-05-06 16:33:47 · 514 阅读 · 0 评论 -
Unicode 和 UTF-8区别
转自https://www.zhihu.com/question/23374078个人学习收藏,侵删------------------------------------简单来说:Unicode 是「字符集」 UTF-8 是「编码规则」其中:字符集:为每一个「字符」分配一个唯一的 ID(学名为码位 / 码点 / Code Point) 编码规则:将「码位」转换为字节序列...转载 2020-05-05 16:54:53 · 171 阅读 · 0 评论 -
Python3中open的newdline参数
来源:https://blog.youkuaiyun.com/hsc_1/article/details/81659935个人学习收藏,侵删---------------------------------------------------------------------------------When reading input from the stream, ifnewlineis...转载 2020-03-13 00:22:26 · 570 阅读 · 0 评论 -
Python中unicode和unicodeescape
来源:https://www.cnblogs.com/leomei91/p/7685797.html个人学习保存,侵删---------------------------------------------------------------在python中,unicode是内存编码集,一般我们将数据存储到文件时,需要将数据先编码为其他编码集,比如utf-8、gbk等。读取数据的...转载 2020-02-19 16:47:20 · 798 阅读 · 0 评论 -
Python3中的unicode_escape
来源:https://www.cnblogs.com/my_captain/p/9092644.html个人学习保存,侵删---------------------------------------------------------------------------一. 响应的两种方式在使用python3的requests模块时,发现获取响应有两种方式 其一,为文本响应...转载 2020-02-19 16:15:16 · 1329 阅读 · 0 评论 -
Python3编码问题汇总
来源:http://www.jb51.net/article/92006.htm个人学习保存,侵删-------------------------------------------------------------------------------------------这两天写了个监测网页的爬虫,作用是跟踪一个网页的变化,但运行了一晚出现了一个问题。。。。希望大家不吝赐教!...转载 2020-02-19 16:03:14 · 247 阅读 · 0 评论 -
用Notepad++的正则表达式进行压缩去词
原字符串:abbbbbijkijkijkijkijkijkijkijkc-------------------------------------------------------------------------------------------------------------目标1:把字符串中连续重复3次以上的单个字符压缩成1次,即把bbbbb变成b...原创 2020-01-31 20:24:49 · 374 阅读 · 0 评论 -
NotePad++ 正则表达式替换 高级用法
转自https://blog.youkuaiyun.com/gdp12315_gu/article/details/51730584仅限个人学习收藏,侵删-------------------------------------------在我们处理文件时,很多时候会用到查找与替换。当我们想将文件中某一部分替换替换文件中另一部分时,怎么办呢? 下面正则表达式 给我提供方法。正则表达式,提供复杂...转载 2020-01-30 18:32:05 · 522 阅读 · 1 评论 -
Python match-search-findall-group(s)的区别
转自https://www.cnblogs.com/mosson/articles/5828433.htmlmatch、search、findall、group(s) 区别 1 2 3 4 5 importre # match findall经常用 # re.match() #从开头匹配,没有匹配到对象就返回NO...转载 2019-04-14 13:54:26 · 499 阅读 · 0 评论 -
UNICODE,GBK,UTF-8区别
转自:https://www.cnblogs.com/gavin-num1/p/5170247.html个人学习收藏使用,如有侵权,请私信联系删除,谢谢。----------------------------------------------------------------------------------一、编码历史与区别 一直对字符的各种编码方式懵懵懂懂...转载 2019-03-31 14:02:03 · 272 阅读 · 0 评论 -
Python正则表达式快速入门
转自https://www.cnblogs.com/mosson/articles/5821825.htm正则本身就是一门语言: 正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串,在文本处理方面功能非常强大,也经常用作爬虫,来爬取特定内容,Python本身不支持正则,但是通过导入re模块,Python也能用正则表达式,下面就来讲一下python正则表达式的用法。下图...转载 2019-04-14 13:46:14 · 1818 阅读 · 0 评论