
Pandas
文章平均质量分 57
林_胖
找工作...找工作...找工作,有单位收留吗?
展开
-
使用Python将Word表格转Excel
今日需求其实就是把Word中的表格转到Excel中,顺便做一个调整。如果单单是两个表格,那只要简单的复制黏贴即可,但如果上百了呢?那就得考虑自动化了。好在今天碰到的需求中的原文件格式是比较有规律的,那直接来尝试一下。# 首先要pip install python-docx# 如果原文件是doc格式,那就先转成docxfrom docx import Documentimport pandas as pdpath = "./word表格转excel.docx"docx = Document原创 2021-03-09 14:13:32 · 2693 阅读 · 2 评论 -
微信群解答_根据给定数据范围划分文件
需求描述参数“氧量”(代号T)划分区间[0,1],[1,1.3],[1.3,1.5],[1.5,1.8],[1.8,2],[2,2.5],[2.5,3],[3,5],[5,10],现在T有9个区间,T01、T02…T09;参数“热值”(代号Q)划分区间[4000,4800],[4800,5200],[5200,5300],[5300,5500],[5500,6500],现在T有5个区间,Q01、Q02…Q05。最后想得到T和Q的排列组合的csv文件,就是T01Q01、T02Q01、T03Q01…这样的原创 2021-01-05 11:36:22 · 252 阅读 · 0 评论 -
一分钟一个Pandas小技巧(四)
暂更至此,有人看再更。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇涉及的知识点:一维表和二维表互换stack()和unstack()pivot()和pivot_table()高性能查询和赋值query()eval()快速计算同比环比、差异diff()pct_change()一维表和二维表互换一维表是指表中各维相互独立,且不可再分的表二维表是指表中部分列不独立,或者说可以归.原创 2020-08-03 00:48:31 · 518 阅读 · 0 评论 -
一分钟一个Pandas小技巧(三)
在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。 本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇所涉及知识点:美化DataFramePython一些好玩的函数Pandas拼接列中出现列表的处理方式accessor窗口函数美化DataFramedf = pd.DataFrame原创 2020-07-21 00:52:22 · 721 阅读 · 0 评论 -
一分钟一个Pandas小技巧(二)
在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。本篇所涉及知识点:map、apply、applymapgroupbyMultiIndex DataFrame统计函数、累计函数agg、transform、filtermap、appl原创 2020-07-16 18:28:03 · 724 阅读 · 0 评论 -
一分钟一个Pandas小技巧(一)
在逛Kaggle的时候发现了一篇不错的Pandas技巧,我将挑选一些有用的并外加一些自己的想法分享给大家。本系列虽基础但带仍有一些奇怪操作,粗略扫一遍,您或将发现一些您需要的技巧。原网址:https://www.kaggle.com/python10pm/pandas-100-tricks纸上得来终觉浅,绝知此事要躬行,所谓的熟练使用Pandas是建立在您大致了解每个函数功能上,希望本系列能给您带来些许收获。创建测试数据Pandas自带的函数,避免了自己手写测试数据的痛苦。索引设置重命名索原创 2020-07-12 19:13:02 · 869 阅读 · 0 评论 -
Pandas_Python处理dhl文件,dict转DataFrame
微信群内搜集到的真实数据清洗工作。需要将dhl格式的文件转为csv文件。数据皆为虚构源数据前两个方括号内分别是日期和字符串,逗号之后是一个完整的字典型字符串。目标格式将前两个方括号内的数据提出,并且字典里的数据也一并提出,合并为一个一维表。代码# 读取dhl文件df = pd.read_table("./1.dhl", header=None)# 使用正则拆分并还原成DataFramedf_new = df[0].str.split("\[(.*?)\]\[(.*?)\],(.*?原创 2020-06-30 01:31:45 · 333 阅读 · 0 评论