python
Alex.liu
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas处理日期函数
import pandas as pdimport dateutil#获取当天的时间curr_time = pd.datetime.today()#对时间进行格式转换为yyyyMMddcurr_date = pd.datetime.strftime(curr_time, "%Y%m%d")#将日期减一天before_1_curr_time = curr_time - dateu...原创 2018-09-14 10:54:21 · 4039 阅读 · 0 评论 -
python在DataFrame中实现hive的array(lateral view explode())行转列,python多列合并成一行
创建数据集dataDict = {‘a’:[‘one’,‘two’], ‘b’:[[2,3],[1,3,6]], ‘c’:[1,2]}dataDf = pd.DataFrame(dataDict)实现行转列,drop(‘level_2’, axis = 1):删掉新产生的索引,level_i中的i为groupby中列数df = t.groupby([‘a’, ‘c’]).b.apply(l...原创 2018-09-27 09:28:13 · 1662 阅读 · 0 评论 -
使用python实现地理位置查询经纬度
地理编码工具geocoder地理编码工具geocoder,不同厂商的服务整合统一起来地理编码import geocoderg = geocoder.google("1403 Washington Ave, New Orleans, LA 70130")g = geocoder.arcgis(u"北京市海淀区上地十街10号")g.latlng输出为[29.9287839, -90....原创 2019-03-28 11:37:05 · 8895 阅读 · 0 评论 -
pandas实现分组排序
import pandas as pddf = pd.DataFrame([['A',1,'2019-03-01 00:00:30'], ['A',3,'2019-04-01 00:00:30'], ['A',2,'2019-03-01 00:00:30'], ['B',5,'2019-...原创 2019-04-10 19:10:29 · 3028 阅读 · 0 评论 -
pandas实现hive的lag和lead函数
lag该函数的格式如下:lag(字段名,N) over(partition by 分组字段 order by 排序字段 排序方式) lag括号里理由两个参数,第一个是字段名,第二个是数量N,这里的意思是,取分组排序后比该条记录序号小N的对应记录的指定字段的值,如果字段名为ts,N为1,就是取分组排序后上一条记录的ts值。lead该函数的格式如下:lead(字段名,N) over(pa...原创 2019-04-11 10:37:26 · 7319 阅读 · 0 评论 -
pandas中利用groupby分组导入数据到excel中
import pandas as pddf = pd.read_table(read_file, header=0, dtype=str, sep='\t')res_file = fileDir + r'\filename.xlsx'writer = pd.ExcelWriter(res_file)groupby_df = df.groupby(['colname'])for i in...原创 2019-04-02 18:03:12 · 8736 阅读 · 0 评论
分享