
pandas
文章平均质量分 51
技术宅不宅
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
墨西哥区域相关的西班牙语日期的处理方案。。
西班牙语带有月份缩写的日期处理原创 2022-01-25 16:34:39 · 517 阅读 · 0 评论 -
pandas处理excel相关,插入折线图并保存xlsx文件用的,搬运一篇外网文章里的内容吧。
先放英文原文链接:原文链接这里好像并没有用到matplotlib,而是直接用了pandas里面的产生insert_chart()的方法。大致过程如下:首先嘛,导包之后,先用xlsxwriter(第三方库,如果没有的话需要pip安装)作为engine,声明一个writer=pd.DataFrame(r’文件绝对路径’ , engine=‘xlsxwriter’)然后就是往writer里df.to_excel(writer , sheet_name=‘工作表名字’),这里的df就是pandas的dat原创 2021-04-16 15:36:16 · 1267 阅读 · 0 评论 -
python中关于面向对象的一些小感悟,库的import问题
python之禅中有“Simple is better than complex.”这么一句话。理解为“简洁比繁琐好”,我觉得是没啥问题的。日常写脚本的时候,导库一般都会统一写在最开头,并且会通过换行,加以区分(无论看视频还是看书,很多示例都会有这样的特点。当然也有例外,但那种可以理解为一段代码里分成不同的功能区域,《轻量级Django》中,第一章部分代码就是这样。)那么如果在写类的时候,里面每写一个方法,都得import一次库,且不说用起来怎么样,光是写的时候,每个方法的开头都得from datet原创 2021-04-08 12:23:23 · 169 阅读 · 0 评论 -
关于pandas+sql使用中的小坑:三个数字列转成字符串,然后补零拼接成新字符串
由于数据库存储日期数据时,年份,月份,日份这三个字段均保存成了整形(int),直接做拼接的话会导致结果出现诡异的情况。。首先,不做转换的话,会直接变成数字相加:year|month|day2021|4|6table[‘year’]+table[‘month’]+table[‘day’]出来的结果是2031。。然后,做了强制转化:year|month|day2021|3|102021|4|6table['date']=table['year'].astype('str')+table['mo原创 2021-04-06 11:10:24 · 559 阅读 · 0 评论 -
记录一下最近在使用pd.pivot_table时遇到的坑:pivot_table的index参数中的列,如果存在nan值,该行记录将会被不计算
如题。最近在做个简易的统计脚本,思路大致描述一下:用到的工具:mysql,selenium.webdriverpymysql,sqlalchemy,pandas,numpymysql的建库建表部份就直接省略了:1,毕竟与这个主题是弱关系;2,大部份的问题都能直接从百度上,甚至直接在优快云网站里检索到;3,关于mysql报错还是提一嘴吧,执行sql语句报错时候会有个报错数字号码(一般为4位数),可以直接按照关键词格式“数据库软件名(空格)报错数字号码”,在搜索引擎(如百度,谷歌,优快云的原创 2021-03-10 12:19:56 · 3248 阅读 · 0 评论 -
pandas处理欧洲区域数据的csv文件,直接通过形参指定千分位和小数点
最近在做数据处理的时候,碰上了欧洲区域的账单,他们的千分位和小数点是这个样子的:可以看到:他们的小数点是英文逗号,而他们的千分位,则是小数点。。当场裂开。。但从pandas的官方文档中,查到pd.read_csv的参数中,有这两项:这意味着,可以通过参数传入,指定千分位和小数点。而原文的括号中,也直接说明了“例如从欧洲地区获取的数据”所以实际上可以通过如下代码解决:import pandas as pdeu_csv_table=pd.read_csv(r'eu_csv.csv',e原创 2021-03-08 16:35:40 · 656 阅读 · 0 评论 -
PANDAS处理英文日期的笨办法
好吧,工作中碰上了这种情况:这是用pandas读取表格后,日期/时间列里面的东西。。>>> order_only_asin_unhvp['date/time']4 Jul 29, 2020 6:18:30 AM PDT>>> type(order_only_asin_unhvp['date/time'][4])<class 'str'>更恶心的是,我还得把这个日期给重新换成日期格式才能继续干活。。看来真就只能做切割了。。。目前原创 2020-09-29 18:52:19 · 1117 阅读 · 1 评论