
数据分析
Python数据分析
GeekLeee
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
把uuid加入DataFrame中并存入SQLite3数据库
import pandas as pdimport uuidimport sqlite3df = pd.DataFrame({'Name': ['John Doe', 'Jane Smith', 'John Doe', 'Jane Smith','Jack Dawson','John Doe']})for name in df['Name'].unique(): df.loc[df['原创 2017-07-07 17:16:43 · 4195 阅读 · 0 评论 -
整理数据代码
import reimport pandas as pdfrom sqlalchemy import create_engineENGINE_EASY = create_engine( "mysql+pymysql://{}:{}@{}:{}/{}".format('xxx', 'xxx', 'xxx', 4171, 'xxx', ), connect_args={"charse原创 2017-07-04 11:30:24 · 720 阅读 · 0 评论 -
pandas
>>> import pandas as pd>>> df = pd.DataFrame([[1,1,1,1],[2,2,2,2],[3,3,3,3],[4,4,4,4]])>>> columns = ["col1","col2","col3","col4"]>>> df 0 1 2 30 1 1 1 11 2 2 2 22 3 3 3 33 4原创 2017-07-04 11:24:08 · 987 阅读 · 0 评论 -
Python Pandas与Numpy中axis参数的二义性
Stackoverflow系列(1) -Python Pandas与Numpy中axis参数的二义性 作者 dudubird85 关注原创 2017-07-04 10:34:33 · 1162 阅读 · 0 评论 -
DataFrame.to_dict(orient='dict')
DataFrame.to_dict(orient=’dict’)>>> df = pd.DataFrame({'name':[1,2,3],"class":[11,22,33],"price":[111,222,333]})>>> df class name price0 11 1 1111 22 2 2222 33 3原创 2017-07-18 17:55:14 · 8817 阅读 · 0 评论 -
pandas对指定列进行填充
>>> import pandas as pd>>> import numpy as np>>> ts1 = [0, 1, np.nan, np.nan, np.nan, np.nan]>>> ts2 = [0, 2, np.nan, 3, np.nan, np.nan]>>> d = {'X': ts1, 'Y': ts2, 'Z': ts2}>>> df = pd.DataFrame原创 2017-07-18 09:51:43 · 14743 阅读 · 1 评论 -
dataframe设置两个条件取值
>>> import pandas as pd>>> import numpy as np>>> from pandas import Series, DataFrame>>> df = DataFrame({'name':['a','a','b','b'],'classes':[1,2,3,4],'price':[11,22,33,44]})>>> df classes name原创 2017-07-17 22:08:18 · 40613 阅读 · 0 评论 -
代码块1
import pandas as pdimport sqlite3from pandas import DataFramefrom sqlalchemy import create_enginecon = sqlite3.connect(r"C:\Users\K\Desktop\excel-upload-sqlite3\mins\db.sqlite3")sql = "SELECT * FRO原创 2017-07-17 17:58:47 · 467 阅读 · 0 评论 -
Merge, join, and concatenate合并,加入和连接
pass原创 2017-08-21 10:46:29 · 1058 阅读 · 0 评论 -
pandas中merge,append,concat的用法
mergeIn [1]: import pandas as pdIn [2]: import numpy as npIn [3]: from pandas import DataFrameIn [6]: df1 = pd.DataFrame({'fund_id':[1,2,3],'statistic_date':[11,22,33],'benc ...: hmark':[111,222,33原创 2017-08-17 10:13:23 · 2546 阅读 · 0 评论 -
np.random模块
标签:【说明】翻译自官网的文档。 随机抽样 (numpy.random)简单的随机数据 rand(d0, d1, …, dn)随机值>>> np.random.rand(3,2)array([[ 0.14022471, 0.96360618], #random [ 0.37601032, 0.25528411], #random [ 0.49313原创 2017-08-07 15:18:29 · 870 阅读 · 0 评论 -
对dataframe进行列相加,行相加
>>> import pandas as pd>>> df = pd.DataFrame({"x":['a','b','c','d'],"y":['aa','bb','cc','dd'],"z":['aaa','bbb','ccc','ddd']})>>> df x y z0 a aa aaa1 b bb bbb2 c cc ccc3 d dd d原创 2017-08-02 15:00:29 · 45387 阅读 · 1 评论 -
pandas聚合和分组运算之groupby
pandas提供了一个灵活高效的groupby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。根据一个或多个键(可以是函数、数组或DataFrame列名)拆分pandas对象。计算分组摘要统计,如计数、平均值、标准差,或用户自定义函数。对DataFrame的列应用各种各样的函数。应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。计算透视表或交叉表。执行分位数分析以及其他原创 2017-07-20 11:33:55 · 3799 阅读 · 0 评论 -
Dataframe的使用方法
现在我们已经学会如何将数据导入 DataFrame 中,我们可以利用它来解决工作上遇到的问题。Pandas提供了大量的函数,本文无法全部覆盖,有兴趣的读者可以详细阅读官方说明文档或者利用 google 搜索更多相关的信息——网上有许多 StackOverflow 的问题和一些介绍该软件库的技术博客。接下来我们将利用MovieLens数据集来介绍 DataFrame 的使用方法。检查数据Pandas原创 2017-07-19 15:50:45 · 5290 阅读 · 0 评论 -
string , datetime, timestamp, time tuple相互转换
string , datetime, timestamp, time tuple相互转换原创 2017-09-01 10:07:14 · 1988 阅读 · 0 评论 -
pd.ols(y=port, x=factors).beta
#计算因子暴露的标准方式是最小二乘回归, 可以使用pandas.olspd.ols(y=port, x=factors).betaC:\ProgramData\Anaconda3\lib\site-packages\IPython\core\interactiveshell.py:2881: FutureWarning: The pandas.stats.ols module is depreca原创 2017-08-29 15:03:37 · 4017 阅读 · 3 评论 -
pandas的apply和map、applymap
apply apply对一个列进行整体运算In [116]: frame = DataFrame(np.random.randn(4, 3), columns=list('bde'), index=['Utah', 'Ohio', 'Texas', 'Oregon'])In [117]: frameOut[117]: b d ...原创 2018-04-26 22:03:38 · 2284 阅读 · 0 评论