python面板数据分析代码_对于大面板数据,回归就绪格式的Excel到Python?

博主试图将Excel中的大面板数据导入Python,进行GMM/横截面面板数据回归分析,但遇到格式问题。已在R和Stata中完成回归分析,想在Python方面提升。展示了从Excel到Python的数据帧格式,还提及在scikit - learn和Statsmodels上找不到输入Excel数据及运行基本OLS的文档。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

试图从Excel中获取一些大面板数据到python中,所以我可以做一些GMM /横截面面板数据回归分析(想想sci-kit软件包)。我把我的数据从excel移到了Python,但是回归分析的格式不正确(见下文)。 Scikit网站上有一些可供玩家使用的数据集,但对于讨论格式以及如何将数据转换为类似的格式以便将数据导入到Python中来说,并不是那么有用。对于大面板数据,回归就绪格式的Excel到Python?

有没有人有任何使用Excel(.xlsx)数据并将其转化为Python的经验,“回归就绪”?

我已经在R和Stata中完成了我所需的回归分析,但是我想在使用Python进行回归分析方面做得更好,因为它有一些很好的属性。

这是我迄今为止的数据帧格式,从excel到Python。 (这是从10000×60形状的数据集截断)

BANKS YEARS CIR DSF EQCUS EQLI EQNT EQUITY

0 CR1 2005 65.46 927915.00 28.553 23.948 37.542 264946.50

1 CR1 2006 65.98 1026491.00 30.491 26.584 36.143 312986.00

2 CR1 2007 60.26 1437615.00 27.003 23.413 28.238 388197.20

3 CR1 2008 58.08 1605464.00 24.024 20.160 25.828 385696.80

4 CR1 2009 65.21 1538570.00 28.160 22.850 27.907 433267.30

5 CR1 2010 54.45 1822863.00 31.009 24.555 28.274 565254.60

6 CR1 2011 57.38 2075505.00 30.905 24.861 29.618 641440.50

7 CR1 2012 62.12 2533641.00 29.595 24.509 28.883 749821.50

数据类型:

>>>df.dtypes

BANKS object

YEARS int64

CIR float64

DSF float64

EQCUS float64

EQLI float64

EQNT float64

EQUITY float64

的Unicode中的列(我不认为科幻套件喜欢这一点!)

>>>df.columns.tolist()

[u'BANKS', u'YEARS', u'CIR', u'DSF', u'EQCUS', u'EQLI', u'EQNT', u'EQUITY']

+0

我没有看到数据集的任何问题。这是一个熊猫数据框,它可以用于scikit-learn。使用这个数据集时你面临的问题是什么? –

+0

我想在scikit-learn页面上,我没有看到任何输入excel数据的文档。我看到的只是他们已经加载的数据集,然后他们开始提取特征,并适合模型。我如何为上面的这些数据运行基本的OLS?我在scikit页面上的任何地方都没有看到。 Statsmodels有类似的文档问题。 –

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值