
pandas
文章平均质量分 52
yuanzhoulvpi
喜欢写代码的数据分析师
展开
-
python tips系列1——pandas的map函数
前言大家在使用pandas的时候,大部分可能就是一些匹配关系,主要也就是使用merge函数之类的。但是有时候在匹配的时候,并不需要使用merge的函数,使用别的函数也是可以做到,今天也就是给大家分享一个找BOSS的代码。问题有这样的一个数据,这个数据的第一列是员工的ID,第二列是员工的Name,第三列是这个员工所属的直接部门,第四列代表这个员工所属的上级部门。那么我要想找到员工的boss应该怎么办?数据代码如下:import pandas as pdimport numpy as npdf =原创 2021-12-23 09:57:42 · 5062 阅读 · 0 评论 -
电脑本地python通过pyodps连接maxcompute
1. 背景:最近公司将数据库从阿里云的adb转换到maxcompute,这次是介绍如何将本地的anaconda环境的python,通过pyodps包连接maxcompute(以下简称mc)2. 需要内容:运维给到的mc账号信息: """用户登录名称 niubi@22333333837828675.onaliyun.com登录密码 hduishcuisbbcsyu{}hauiidhiauhsAccessKey ID dschuivdsbyfydgywycsbbAccessKey S..原创 2021-07-28 19:40:26 · 2861 阅读 · 2 评论 -
flask将pandas数据框返回为json
最近做项目遇到就是需要使用flask将pandas的数据框导出为json;我看到网上有很多是介绍用falsk的jsonify办法,我这里换一个方法,使用flask的Response函数from flask import Flask, jsonify, request, Responseimport pandas as pdimport numpy as np然后在返回pandas的时候,可以这样包装:Response(result.to_json(orient="records")原创 2021-03-04 10:32:48 · 621 阅读 · 1 评论 -
kaggle上的pandas小技巧
kaggle上有很多大神,对数据处理非常有心得。感觉是时候做一次总结。这一次主要是介绍kaggle上的titanic数据集的一个notebook。链接为:https://www.kaggle.com/startupsci/titanic-data-science-solutions这个notebook主要的还是面向入门的python数据处理用户。Q1:如何获得pandas里面数据框(DataFrame)的列名字,如何提取,如何修改?对于上面的train这个数据的列名字,可以使用tra.原创 2020-07-11 11:59:33 · 445 阅读 · 0 评论 -
我的pandas总结
第一个是关于使用statsmodels包提取调整后的R^2。原来直接加在后面就行了。def my_f2(x): temp_x = x['Ask Size'] - x['Bid Size'] temp_y = x['mid quote return'] temp_x = sm.add_constant(temp_x) results = sm.OLS(temp_y...原创 2020-04-27 00:16:02 · 319 阅读 · 0 评论