
正则表达式
碣石观海
幸甚至哉,歌以咏志
展开
-
批量生成pdf书签目录之目录自动格式化(Python实现)
一、动机针对网上下载到的pdf书籍,很多都是没有书签目录的,给读者看起来很不方便,下面就有了这个半自动生成书签目录的方法。本文的主要思路来源于Ghoset 博主的《批量给pdf添加目录(最完整详细方法)》,主要是把其中对目录手动格式化的一步进行了自动化,写成了代码,打包成了工具,算是一个补充。二、利用正则将目录格式化简析2.1 参考正则表达式模式^ 匹配字符串的开头 ...原创 2019-01-26 18:15:47 · 4600 阅读 · 4 评论 -
Apache服务器日志Log解析
------------本文笔记整理自《Hadoop海量数据处理:技术详解与项目实战》范东来一、Apache服务器日志信息组成说明1. group-0 是一条初始的log日志信息;2. group-1 ~ group-15 是对该条日志正则解析后的结果。一条原始log日志: group-0 : 120.196.145.58 - - [11/Dec/2013:10:00:32 +...原创 2019-05-22 00:37:22 · 2935 阅读 · 0 评论