1.pandas的一个技巧
apply() 和applymap()是DataFrame数据类型的函数,map()是Series数据类型的函数。apply()的操作对象DataFrame的一列或者一行数据, applymap()是element-wise的,作用于每个DataFrame的每个数据。 map()也是element-wise的,对Series中的每个数据调用一次函数。
2.PCA分解德国DAX30指数
DAX30指数有三十个股票,听起来不多的样子,其实还是挺多的,我们很有必要对其进行主成分分析,然后找出最重要的几个股票。想必PCA的原理大家应该都是知道,说白了就是在一个回归中找到影响最大的那几个,当然,数学原理就涉及矩阵分解,什么SVD呀。
先上点代码
import pandas as pd
import pandas.io.data as web
import numpy as np
np.random.seed(1000)
import scipy.stats as scs
import statsmodels.api as sm
import matplotlib as mpl
import matplotlib.pyplot as plt
from sklearn.decomposition import KernelPCA#导入机器学习的PCA包
symbols = ['ADS.DE','ALV.DE','BAS.DE','BAYN.DE','BEI.DE','BMW.DE','CBK.DE','CON.DE','DAI.DE',

本文介绍了使用pandas的apply()、applymap()和map()函数处理DataFrame数据,并探讨了如何在金融数据分析中应用PCA进行主成分分析。以德国DAX30指数为例,通过PCA降低维度,发现仅使用前几个主成分就能得到很好的拟合效果,为数据分析提供高效途径。
最低0.47元/天 解锁文章
4191

被折叠的 条评论
为什么被折叠?



