
python办公自动化
萌兔biubiu
编程小白,女性,出于提升工作效率需要以及兴趣自学,vba,python,jsa,写博客是记录自己需要的知识点,人脑逻辑写代码,有不专业的地方请多包涵
展开
-
ERROR: No matching distribution found for setuptools>=40.8.0解决方法
前提是检查自己的电脑setuptools版本正确,环境变量正确,也不存在虚拟环境,那么有可能是wheel包出现问题,试试升级wheel库,再安装,详见我的博文。我有一个报错是 安装了wheel库以后 这个报错就没了。原创 2023-08-28 15:15:33 · 1859 阅读 · 0 评论 -
because file is missing, has improper permissions, or is an unsupported or invalid format报错
使用pyaotugui 定位指定的图片报错。原因是图片路径中有汉字,重新设置路径为纯字母的就可以解决问题。原创 2023-08-30 14:15:23 · 1863 阅读 · 0 评论 -
虚拟环境下把python代码打包成exe(小白教程)
注意 我这里用的是虚拟环境,所以我即使系统里面两个 python版本 有pip32 和pip64 也都可以不用,只用pip命令就可以安装 pyinstaller了。4、虚拟环境下可以安装代码需要的库,比较简单的是利用pycharm 先把需要安装的库弄好,直接把package文件夹里面的东西全部替换掉。我之所以用pip32因为我电脑上装了两个版本的python 一个是32位一个是64位,如果你电脑上只有一个版本的python就用。在想打包的地方新建一个虚拟环境,比如我想在D盘的某文件夹下新建虚拟环境。原创 2022-11-23 14:15:18 · 3812 阅读 · 3 评论 -
python选择文件夹,并自动发送这个文件夹下的所有文件(以附件的形式)至指定邮箱(通过163邮箱)
工作中需要将自动生成的表格发送给办公邮箱继续处理,结合遍历文件夹和自动发邮件,做出了可以选择文件夹,并自动发送这个文件夹下的所有文件(以附件的形式)至指定邮箱。原创 2022-10-31 15:31:58 · 924 阅读 · 2 评论 -
PYTHON遍历文件夹和子文件夹,把所有的文件以列表形式输出,同时列表输出所有的文件夹
在脚本之家看到的,我做了小小的修改,修改为弹出对话框,自己选择遍历哪个文件夹。原创 2022-10-31 14:49:42 · 1195 阅读 · 0 评论 -
python自动发送163邮箱,带附件与不带附件
其中最后一段我标记了原博主写的和我写的不一样我用原博主的无法发送,改成我这样的成功了,打开可以试试。需要用163邮箱向办公邮箱发送数据,搜索大量代码发现两个亲测可用的代码,转载过来。转载 2022-10-31 12:54:38 · 755 阅读 · 0 评论 -
爬取网站上的信托计划净值数据写入excel,涉及dataframe排序,转换数据类型,列表填入dataframe,取小数点后四位的正则,dataframe生成excel
实际上我只想要2022-10-26 0.6711 2.8648 2.XXXX这种规律的数据,但是经过多次搜索(原谅我是小白),发现正则表达式只能提取连续的数据。由于原始内容里面还有很多单独的日期,所以我如果利用正则|,来提取,就会多出来几个光秃秃的日期,不利于数据的一一匹配。把符合条件的成组的text先提取出来,再利用二次提取分别提取日期和净值,就保证能一一对应了。下面这个正则 好像可以通过 group二次提取就可以直接提取想要的数据了。所以我经过观察数据,选择提取一大段,如图彩色部分。原创 2022-10-28 13:37:46 · 144 阅读 · 0 评论 -
dataframe读取excel去掉上面几行和下面几行
def read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0,index_col=None, names=None, usecols=None, parse_dates=False,date_parser=None, na_values=None, thousands=None,convert_float=True, converters=None, dtype=None,true_values=None, false原创 2020-09-01 11:50:34 · 1780 阅读 · 0 评论 -
遍历dataframe中的某列,找出含有空格的元素
工作上需要处理一个数据,把一个较大数据中的姓名列和账号列全部遍历一遍,然后看是否数据里面含有空格一开始想法是用for循环,一行一行遍历df数据,这个方法效率太慢,搜索一下,有个博主发现了一个map函数,太厉害了,我直接用了,准备先贴我的代码,后面是博主的原贴import pandas as pd import numpy as np import datetime import shutil import xlwings as xw import os date_today = dateti转载 2020-08-06 15:06:13 · 3633 阅读 · 0 评论 -
python读取.csv文件时报错解决方案(无法打开“parsers.pyx”: 找不到文件)
版权声明:本文为优快云博主「Jayden yang」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.youkuaiyun.com/qq_41997920/article/details/88988307利用pandas打开.csv文件时,一直报错。原因如下:一般情况:文件中带有中文字符,或者文件名称含有空格符号python读取不到路径(大多数都是这种原因)解决方案:(1)获得当前的工作路径,把你的数据文件放在此路径上就可以了,就可以转载 2020-06-28 15:13:44 · 2793 阅读 · 0 评论 -
dataframe将某列的空值填充为12
工作中遇到某列数据中空值需要替换为12df['支付周期'].fillna(12, inplace=True)原创 2020-05-27 18:59:27 · 3299 阅读 · 0 评论 -
dataframe读取以文本形式储存的excel中的数字
Df_mydic_normal = pd.DataFrame(pd.read_excel(Name_mydic_normal,header=None,names=['常规名','常规号'],converters = {'常规号':str}))原创 2020-01-05 15:50:08 · 2629 阅读 · 0 评论 -
将dataframe中的某列字符串化
raw_data['身份证'] = raw_data['身份证'].astype(str)原创 2020-01-05 15:09:00 · 7507 阅读 · 0 评论 -
将dataframe里的两列元素一个作为key一个作为value转换成字典
result_dic = df.groupby(‘word’)[‘count’].apply(lambda x:str(x)).to_dict() # 如果把str(x)换成x,结果完全不一样,目前还不是很理解。result_dic = df.groupby(‘word’)[‘count’].apply(lambda x:str(x)).to_dict() # 对于同一个key对应一个value,直接使用value。我发现 用上面的 代码 还是形成value 是一个列表的字典。原创 2020-01-05 14:55:09 · 1244 阅读 · 1 评论 -
dataframe列的拼接
将daraframe两列进行拼接Df_rawData_new=Df_rawData['银']+Df_rawData['名称']原创 2020-01-05 14:48:58 · 800 阅读 · 0 评论 -
自动粘贴dataframe中的元素的具体值
就可以把Df_newdata第一行第二列的值复制到粘贴板了。代码中最后一句 加上这个。原创 2020-01-03 13:11:58 · 183 阅读 · 0 评论 -
dataframe定位列中包含某个指定字符,替换为另外一个值
类似一个字典的填充功能吧,可以自己转变为遍历字典,然后填充整个dataframe。日常工作中遇到dataframe某列含有某个关键字,另一列填充指定的字符,例子中指的是:定位列中含有‘巴拉巴拉’的,号码列中填入1021000999。原创 2020-01-01 16:27:24 · 11314 阅读 · 0 评论 -
读取没表头的excel为dataframe,并添加虚拟列名
model_bankcode_data = pd.DataFrame(pd.read_excel(model_bankcodestr,header=None,names=['统一行别名称','统一行号']))如图,实现了没有表头非让数据表,读取为dataframe,且添加了虚拟列名...原创 2019-12-29 18:19:52 · 3643 阅读 · 0 评论 -
dataframe某列去重最快的方式,以及使用xlwing把列表中的内容粘贴进excel
如图,我需要对某数据进行数据清洗,其中开户行别需要统一,即,中国银行,中国银行股份有限公司,这种实际上是一个行别,需要统一,目前需要把十几万条数据,行别字段进行去重,先看看公共有哪些行别用到的方法为set直接用set 也是很快的,我试了一下set 和dict 以秒为单位运行13万数据没有差别,那不如用代码简单的哦list_bankcode_net=list(set(list(raw_dat...原创 2019-12-29 18:13:06 · 2155 阅读 · 0 评论 -
完美解决dataframe添加列,并且指定列的位置
需求是这样的:我需要从原始表中提取几列数据,分别填入税表的人员和收入表中,原始表中只有 姓名、身份证号码、年金领取额是有效数据但是税务局的模板表中有一大堆莫名其妙的字段不需要填写先把原始表定义一下,把身份证字符串一下再把需要的人员,收入表需要的原始表中的列复制过来现在就需要在data_person和data_income中分别添加莫名其妙的字段列了raw_data = pd.DataF...原创 2019-12-16 23:33:31 · 1790 阅读 · 0 评论 -
利用python处理excel
本宝宝有个工作中需要报送乃年金个人所得税,其实以前我写过一个集成报送各年金计划的vba的小代码,但是因为新接的任务数据量太大,vba可能会假死,即使能处理,也因为最近在自学python,所以想尝试用python我的思路是:把报税模板复制出来,然后每月自动根据年金领取信息填写保存,吐槽一下,税表模板是xls,只支持6万数据,我尝试用一个xlsx文件上传,不过也成功了,嘻嘻,所以我手工把模板改成xl...原创 2019-12-15 14:39:14 · 220 阅读 · 0 评论 -
python使用padans,numpy库读取csv数据
因工作需要,宝宝需要对14万行两列,列名分别为代码,单位名称的csv文件进行整理,根据单位名称字段填写,省、市。网上搜索一下pandas可以进行csv的读写,唉没办法,虽然我python刚学到文本文件读取,但是工作被逼无奈,赶鸭子上架就这么滴开干了我用的是pycharmimport pandas as pdimport numpy as npfile_bankcode=pd.read_cs...原创 2019-12-12 20:34:58 · 1400 阅读 · 0 评论