
python基础
文章平均质量分 66
lanlan_bupt
一只快乐的程序猿
展开
-
python 调用 office 实现自动 pdf转word
前言pdf转word一直是个问题,尝试了很多方法,解析图片识别图片之类的,最后发现office的pdf转word功能是最好的,微软不愧是微软呀。需求需要windows系统并安装office代码原理office的word是可以直接打开并转换pdf的。并且效果很不错。手动测试一下:随便找到一个pdf,右键-》打开方式-》选择其他应用-》找到word打开之后会出现一个弹窗,选上不再显示,点确定(我不知道这个弹窗会不会影响代码,如果代码失败,那就手动先点一下这个弹窗再运行代码)原创 2021-08-05 18:09:19 · 622 阅读 · 4 评论 -
python PDFMiner 处理pdf,保存文本及图片
前言网上的资料意外地少,尤其是图片的处理,基本上都是官方文档,整了半天,记录一下。资料先放一下官方文档及翻译,建议看看官方文档。官方文档:https://euske.github.io/pdfminer/programming.html翻译:https://blog.youkuaiyun.com/robolinux/article/details/43318229安装我是python3,一开始装了一个pdfminer,装了一个pdfminer3k,但是使用时报错:ImportErr..原创 2021-05-11 18:24:51 · 4194 阅读 · 6 评论 -
python基础工具函数——matplotlib绘图
原博:https://www.cnblogs.com/onemorepoint/p/7482644.html使用matplotlib.pyplot库进行绘图,这个库是python里面的一个matlab的接口,和matlab绘图的方式相同。这个库要基于numpy,安装numpy然后直接pip这个库pip install Matplotlib下面是使用:#import:im...转载 2019-05-28 23:33:41 · 3384 阅读 · 3 评论 -
python——pyinstaller打包exe
我居然没记。。。。来记录一下installpip install pyinstaller然后就会发现在你python的Scripts目录下多了一个pyinstaller.exe打包打包命令为:pyinstaller -F-w xxx.pyxxx.py是你的要打包的py程序。事实上windows下要直接使用pyinstaller命令的话应该需要配置环境变量,我懒得...原创 2020-03-06 10:07:24 · 156 阅读 · 0 评论 -
python简单函数记录——random随机函数
遇到了,先记着,持续补充import自带库,不需要pipimport randomrandint两个参数之间随机取一个整数。包括首尾。random.randint(0,2)#可能结果:0,1,2sample从一个列表里随机抽取指定个数的元素。ls=[1,2,3,4,5,'a','b','c','d','e']sample = random.sample...原创 2020-03-05 09:48:25 · 668 阅读 · 0 评论 -
python脚本 随机分开训练集测试集文件
代码老忘,记录一下主要就是random.sampleimport os,random,shutil#文件路径listfileDir='./label/'pathdir=os.listdir(fileDir)rate=0.8picknumber=int(len(pathdir)*rate)sample = random.sample(pathdir, picknumber)...原创 2019-12-23 17:52:23 · 245 阅读 · 0 评论 -
python简单函数记录——math数学处理函数
遇到了先记着,持续补充浮点数向上取整math.ceil(1.2)#结果为2,等于int(1.2)+1原创 2019-12-12 15:41:30 · 128 阅读 · 0 评论 -
python基础库函数——logging写日志
上代码:import logging#写日志文件logging.basicConfig(level=logging.INFO, # 控制台打印的日志级别 filename='thelog.log',#写了这个就不会打印到控制台 filemode='a', ##模式,有w和...原创 2019-10-11 17:08:50 · 427 阅读 · 0 评论 -
python处理时间模块——datetime
mysql数据库里面取出来的时间是datetime类型,关于它的函数总记不住,记录一下#datetime包里面有三种类,datetime,time和date。#这里引用datetime类。别的等用到了再补充from datetime import datetime#取当前时间now_time=datetime.now()now_time#datetime.datetime(2...原创 2019-09-23 11:00:16 · 219 阅读 · 0 评论 -
python基础技巧记录——list 和set查找效率
今天使用list存储一个大数据列表,实行遍历查找的时候发现比昨天慢了很多,去看了一下昨天的代码,发现昨天是用set进行存储的。去查了一下,set是哈希表结构存储,而list是顺序结构,存储时只能顺序查找。我知道dict是哈希表,原来set也是哈希表啊,怪不得快。超快,十几万条查找一下子就找完了。...原创 2019-08-16 09:58:04 · 1390 阅读 · 0 评论 -
python简单函数记录——字符串用法记录
我总是记不住strip和split怎么拼,记录一下strip去掉字符串两端的某种特殊字符,默认为空格和换行符。同理只去左边的有lstrip,右边有rstripa=' ahf uq p pq135c \n'a.strip()#'ahf uq p pq135c'a.strip('\n')#' ahf uq p pq135c 'a.strip(' ')#'a...原创 2019-08-15 09:21:58 · 117 阅读 · 0 评论 -
python简单用法记录——str/list切片[::-1]
用了这么久python,这个用法都不知道。惭愧惭愧。学东西杂而不精。python可以简单快速的将list和string切片。以前一直只知道一个冒号的使用方法,写东西麻烦了不少。惭愧惭愧。一个冒号的首尾切片非常简单。就这样的。a=[0,1,2,3,4,5,6,7]a[:-1]#[0, 1, 2, 3, 4, 5, 6]a[3:5]#[3, 4]#这里注意,返回的数字...原创 2019-08-05 17:06:51 · 1065 阅读 · 0 评论 -
python简单函数记录——sort排序函数
多个相关列表一起排序的时候可以用元组列表排序,记录一下排序sort的用法sort首先是sort,sort排序要改变原列表,sort很简单#设置两个列表a=[1,2,3,4,5]b=[9,8,7,6,5]#给b排序b.sort()pirnt(b)#结果:[5, 6, 7, 8, 9]sortedsorted相对比较复杂。#sorted不改变原列表a=[...原创 2019-07-17 11:32:32 · 370 阅读 · 0 评论 -
python简单函数记录——json文件处理函数
处理大数据有很多要用到json文件,存成json文件格式或者要读取。搜集了一些资料简单整理一下首先导入json包import jsonjson文件主要有两个方法:数据——json文件之间的两种转换方法。json.loads(data) #从字符串中读取json数据文件json.dumps(data) #将json数据人家格式化为字符串写json文件data的数据类型如...原创 2019-07-17 11:02:31 · 226 阅读 · 0 评论 -
Python简单函数记录——format格式化函数
个人记录,用到的东西,怕忘。函数str.format(),对str进行格式化。使用大括号{}作为占位符,代替c里面的%2d,%5f之类的来进行格式化操作。实例:#这一段摘自runoob教程>>>"{} {}".format("hello", "world") # 不设置指定位置,按默认顺序'hello world' >>>...原创 2019-07-11 14:29:40 · 351 阅读 · 0 评论