
Python
哈伦2019
金融大数据统计
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
金融统计分析与挖掘实战8.3-8.4
第八章 上市公司综合评价# 设置工作路径和导入基本数据分析包import osos.chdir("C:\\Users\\Administrator\\Desktop") #设置路径import pandas as pdimport numpy as np8.3 基于总体规模与投资效率的综合评价8.3.1 数据读取与处理data=pd.read_excel('data.xlsx') #读取数据data2=data.iloc[data['Accper'].values=='2016-12原创 2022-05-18 15:22:02 · 2348 阅读 · 1 评论 -
金融统计分析与挖掘实战7.6-7.7
7.6 沪深300指数走势预测import osos.chdir("C:\\Users\\Administrator\\Desktop") #设置路径import pandas as pdimport numpy as np7.6.1 读取数据td=pd.read_excel('index300.xlsx') # 读取数据td.head(6) # 查看前6行 Indexcd Idxtrd01 Idxtrd02原创 2022-05-13 15:40:20 · 1818 阅读 · 1 评论 -
金融统计分析与挖掘实战7.3-7.5
# 7.3 上市公式净利润增长率计算import osos.chdir("C:\\Users\\Administrator\\Desktop")import pandas as pddt = pd.read_excel('data2.xlsx') #获取数据dt.head(6) Stkcd Accper B002000101 0 16 2014-12-3原创 2022-05-11 15:27:08 · 3067 阅读 · 1 评论 -
金融统计分析与挖掘实战6.1-6.3
# 6.1 关联规则import numpy as npimport pandas as pdimport osos.chdir("C:\\Users\\Administrator\\Desktop") #更改工作路径,注意双\\ 任何操作前可以先将常用包和路径先设置好# 6.2.1 一对一关联规则挖掘# 将原始数据转化为布尔数值表tiem = ['西红柿','排骨','鸡蛋','茄子','袜子','酸奶','土豆','鞋子']data = pd.read_excel('tr.xlsx'原创 2022-05-04 15:39:45 · 1518 阅读 · 2 评论 -
金融数据分析与挖掘实战5.6-5.7
# 5.6 支持向量机#汽车评价数据,6个特征变量,1个分类标签,共1728条记录#要求取1690条记录作为训练集,余下的作为测试集,计算预测准确率import numpy as npimport pandas as pdimport osos.chdir("C:\\Users\\Administrator\\Desktop") #更改工作路径,注意双\\ 任何操作前可以先将常用包和路径先设置好# 1.读取数据data = pd.read_excel("car.xlsx")datah原创 2022-04-29 15:39:33 · 768 阅读 · 0 评论 -
金融统计分析与挖掘实战5.3-5.5
# 5.3 线性回归应用# 一、准备工作(导入包,输入数据,选择变量)import numpy as npimport pandas as pdimport osos.chdir("C:\\Users\\Administrator\\Desktop") #更改工作路径,注意双\\ 任何操作前可以先将常用包和路径先设置好data = pd.read_excel("发电场数据.xlsx")datah = data.head(6) #看前6行的数据,本例中有9000多样本,显示全占用篇幅较大原创 2022-04-27 17:26:14 · 1469 阅读 · 0 评论 -
金融统计分析与挖掘实战5.1-5.2
# 第5章 机器学习包# 5.2.1 缺失值处理import numpy as npimport pandas as pdimport osos.chdir("C:\\Users\\Administrator\\Desktop") #更改工作路径,注意双\\ 任何操作前可以先将常用包和路径先设置好data = pd.read_excel("missing.xlsx") #将文件放到工作路径下,用该命令读取数据print(data) a b c d0 2.原创 2022-04-22 17:11:27 · 902 阅读 · 0 评论 -
金融统计分析与挖掘实战3.3.3-3.5
# 3.3.3 数据框# 8.as_matrix()报错import pandas as pdimport numpy as nplist1 = [1,2,3,4,5,6]list2 = [2,3,4,5,6,7]D = pd.DataFrame({"m1":list1,"m2":list2})print(D) m1 m20 1 21 2 32 3 43 4 54 5 65 6 7D1 = D.as_matrix()原创 2022-04-13 17:19:24 · 396 阅读 · 0 评论 -
金融统计分析与挖掘实战3.3.1-3.3.3
# 3.3 数据框 # 特征:多个序列按照相同的索引组成的二维表# 3.3.1 数据框的创建import pandas as pdimport numpy as np # 先导入两个最常用的数据处理分析包data = {"a" : [2,2,np.nan,5,6],"b" : ["kl","kl","kl",np.nan,"kl"],"c" : [4,6,5,np.nan,6],"d" : [7,9,np.nan,9,8]} #生成一个字典df = pd.DataFrame(data)原创 2022-04-08 17:37:40 · 1940 阅读 · 0 评论 -
金融统计分析与挖掘实战3.1-3.2
# 第三章 数据处理包 pandas# 3.2序列#3.2.1 序列的创建与访问import pandas as pdimport numpy as np # 数据分析前先导入两个最常见的包# 创建序列# 列表、元组和数组转化为序列s1 = pd.Series([1,-2,2.3,'hq']) #把列表转换为序列print(s1) #虽然我们没写索引,但系统默认了索引0 11 -22 2.33 hqdtype: objecttyp原创 2022-04-06 17:18:16 · 1131 阅读 · 0 评论 -
金融数据分析与挖掘实战练习2.10
# 2.10矩阵及线性代数的运算# 2.10.1 创建矩阵import numpy as npmat1 = np.mat("1 2 3 ; 4 5 6 ; 7 8 9")print(mat1)[[1 2 3] [4 5 6] [7 8 9]]type(mat1)numpy.matrixmat2 = np.matrix([[1,2,3],[4,5,6],[7,8,9]])print(mat2)[[1 2 3] [4 5 6] [7 8 9]]type(mat2)n原创 2022-04-01 17:34:22 · 766 阅读 · 0 评论 -
金融数据分析与挖掘实战练习2.5-2.9
# 2.5.1数组切片#满足条件的切片import numpy as npD = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]) #定义数组print(D)[[ 1 2 3 4] [ 5 6 7 8] [ 9 10 11 12] [13 14 15 16]]# 将D中的第0列大于5的所有列数据取出D1 = D[D[ : ,0] > 5, : ]print(D1)[[ 9 10 11 12]原创 2022-04-01 09:52:05 · 1167 阅读 · 0 评论 -
金融数据分析与挖掘实战练习2.1-2.4
#逻辑运算符3 and 443 and 5 and 8 # 如果用and连接多个正整数,那么将显示最后的那个83 and 8 and 553 or 5 or 8 #如果用or连接多个正整数,那么将显示最前面的那个38 or 5 or 385 > 3 < 4 #相当于5>3 and 3<4True#逻辑否运算 not5 > 4True not 5 > 4Falsenot 3 > 4True原创 2022-03-25 17:38:21 · 2004 阅读 · 0 评论 -
金融数据分析余挖掘实战1.9-1.10补充
# 1.9.2 有返回值的函数def sumt(t): #求1一直加到t的和 s = 0 while t > 0: s = s + t t = t - 1 return ss = sumt(30) #从1加到30的结果print(s)465s = sumt(50) #从1加到50的结果print(s)1275# 如果返回命令写错,比如写成了返回 tdef sumt1(t): #求1一直加到t的和原创 2022-03-23 17:39:15 · 547 阅读 · 0 评论 -
金融数据分析与挖掘实战练习-1.9
# if while 的综合运用# 猜数字#请猜我心中的那个数字(假如是10)s = input("请猜测我心中记住的那个数字是:")guess = int(s)if guess == 10: print("你很聪明呀,一下子就猜对了!")else: print("很遗憾!我心中的那个数字是10")print("游戏结束,不玩啦!") #缩进很重要,此处顶格写,表示是最外层的程序,一定会执行请猜测我心中记住的那个数字是:10你很聪明呀,一下子就猜对了!游戏原创 2022-03-18 17:44:42 · 4426 阅读 · 0 评论 -
金融数据分析与挖掘实战1.7-1.8
#1.7练习:如果成绩为60分以下,记为E,60-70 记为D,70-80 记为C ,80-90记为B,# 90-100记为A,某个同学成绩为75分,请设计一个if语句打印输出结果#采用if语句进行操作score = 75if 100 >= score >= 90: #最基础、最直接的条件表达 print("A")if 90 > score >= 80: print("B")if 80 > score >= 70: print(原创 2022-03-16 17:42:40 · 799 阅读 · 0 评论 -
金融数据分析与挖掘实战1.6-1.7
#1.6 字典的基本操作# 创建字典d = dict() #创建一个空字典d = {}type(d)dictlist1 = [("a",'ok'),('1','lk'),("001",'lk')] #列表中嵌套元组d1 = dict(list1)print(d1){'a': 'ok', '1': 'lk', '001': 'lk'}list11 = [("a",'ok'),('a','lk'),("001",'lk')] #列表中嵌套元组d11 = dict(lis原创 2022-03-11 17:47:07 · 754 阅读 · 0 评论 -
金融数据分析与挖掘实战1.5.2-1.5.3
元组,字符串的基本操作原创 2022-03-09 17:41:07 · 330 阅读 · 0 评论 -
金融数据分析与挖掘实战1.4.4-1.5.1
# 1.4.4 统计L1 = [1,2,3,4,5,6]t1 = (1,2,3,4,6)s2 = 'hello word!'m1 = max(L1)print(m1)6m2 = max(t1)print(m2)6m3 = min(t1)print(m3)1m4 = sum(L1)print(m4)21m5 = max(s2)print(m5)wm6 = min(s2) # 不输出结果print(m6)J1 = {1,2,3,4,5,6原创 2022-03-08 11:54:26 · 383 阅读 · 0 评论 -
金融数据分析与挖掘实战1.3.1-1.3.6
Python基础原创 2022-03-02 17:49:29 · 251 阅读 · 0 评论 -
金融数据分析与挖掘实战1.4.1-1.4.3
2021-2022-2 (2)Python基础课程原创 2022-03-02 17:40:42 · 389 阅读 · 0 评论 -
关联规则mlxtend的应用
#购物篮例子,找出关联规则item_list1 = [['西红柿','排骨','鸡蛋'], ['西红柿','茄子'], ['鸡蛋','袜子'], ['西红柿','排骨','茄子'], ['西红柿','排骨','袜子','酸奶'], ['鸡蛋','茄子','酸奶'], ['排骨','鸡蛋','茄子'], ['土豆原创 2021-06-02 19:55:01 · 857 阅读 · 1 评论 -
apriori关联规则
pip install mlxtend #注意在jupyter里面操作要加!The following command must be run outside of the IPython shell: $ pip install mlxtendThe Python package manager (pip) can only be used from outside of IPython.Please reissue the `pip` command in a separate t原创 2021-05-31 20:32:22 · 933 阅读 · 2 评论 -
Python 第五章 因子分析
#相关系数矩阵import pandas as pdData=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')X=Data.iloc[:,1:]R=X.corr()print(R) 工资性收入 经营净收入 财产净收入 转移净收入工资性收入 1.000000 -0.388997 0.826683 0.401917经营净收入 -0.388997 1.000000 -0.205737 -0.314542财产净收入原创 2021-05-10 20:42:27 · 1415 阅读 · 0 评论 -
Python 第五章 数据预处理
#缺失值填充import pandas as pdimport numpy as npdata=pd.read_excel('missing.xlsx') #数据框datac=np.array([[1,2,3,4],[4,5,6,np.nan],[5,6,7,8],[9,4,np.nan,8]]) #数组cC=pd.DataFrame(c) #数据框C# 1.均值填充策略f原创 2021-05-10 20:39:52 · 336 阅读 · 0 评论 -
时间字符串与时间戳批量转换
原文博客地址:https://blog.youkuaiyun.com/s1164548515/article/details/100186773 时间字符串与时间戳批量转换转载 2020-06-20 10:01:19 · 1148 阅读 · 0 评论 -
线性回归(六)岭回归、lasso回归和弹性网络回归比较
预测儿童身高案例案例背景介绍理论上,一个人的身高除了随年龄变大而增长之外,在一定程度上还受到遗传和饮食习惯以及其他因素的影响。在这里我们把问题简化一下,假定一个人的身高只受年龄、性别、父母身高、祖父母身高和外祖父母身高这几个因素的影响,并假定大致符合线性关系。%config InteractiveShell.ast_node_interactivity = 'all' #同时输出多行结果import copyimport numpy as npfrom sklearn import line原创 2020-06-03 11:28:47 · 3536 阅读 · 0 评论 -
线性回归(五)---弹性网络回归
弹性网络回归弹性网络ElasticNet是同时使用了系数向量的 l1 范数和 l2 范数的线性回归模型,使得可以学习得到类似于Lasso的一个稀疏模型,同时还保留了 Ridge 的正则化属性,结合了二者的优点,尤其适用于有多个特征彼此相关的场合。主要参数说明alpha: a值。fit_intercept:一个布尔值,指定是否需要计算b值。如果为False,那么不计算b值(模型会认为你已经将数据中心化了)。max_iter:整数值,指定最大迭代次数。normalize:一个布尔值。如果为True原创 2020-06-01 15:58:55 · 8721 阅读 · 1 评论 -
线性回归(四)---Lasso回归
Lasso回归Lasso是可以估计稀疏系数的线性模型,尤其适用于减少给定解决方案依赖的特征数量的场合。如果数据的特征过多,而其中只有一小部分是真正重要的,此时选择Lasso比较合适。在数学表达上,Lasso类似于岭回归,也是在代价函数基础上增加了一个惩罚项的线性模型。主参数设置alpha : float, 可选,默认 1.0。当 alpha 为 0 时算法等同于普通最小二乘法,可通过 Linear Regression 实现,因此不建议将 alpha 设为 0.fit_intercept : bo原创 2020-05-29 11:48:39 · 4515 阅读 · 0 评论 -
线性回归(三)---岭回归
岭回归岭回归是一种用于共线性数据分析的有偏估计回归方法,是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价从而获得更符合实际、更可靠的回归系数,对病态数据(这样的数据中某个元素的微笑变动会导致计算结果误差很大)的拟合效果比最小二乘法好。岭回归通过在代价函数后面加上一个对参数的约束项来防止过拟合。岭回归参数含义alpha:{float,array-like},shape(n_targets)正则化强度; 必须是正浮点数。 正则化改善了问题的条件并减少了估计的方差。原创 2020-05-28 09:53:22 · 2378 阅读 · 0 评论 -
线性回归(二)---多元线性回归
多元线性回归一个因变量依赖两个或两个以上自变量变化而变化的回归模型称为多元线性回归 ● 一元线性回归: y(x)=theta0 + theta1* x 1 ● 多元线性回归: y(x)=theta0 + theta1* x 1 + theta2* x 2 + theta3* x 3 ● 多项式(曲线)回归: y(x)=theta0 + theta1* x 1 + theta2* (x2^2) + theta3* (x3^3) 属于多元线性回归 多元线性回归还原创 2020-05-22 12:39:12 · 1572 阅读 · 0 评论 -
线性回归(一)---一元线性回归
线性回归(一)线性回归是分析因变量与自变量呈现线性关系的一种方法,来确定一个因变量如何依赖一个或多个自变量的变化而变化,运用十分广泛。在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。线性回归常用参数:regression.intercept_ : 截距, 默认为True,可选Falseregression.coef_ :原创 2020-05-20 17:32:48 · 2433 阅读 · 0 评论 -
金融数据分析与挖掘实战 4.2 Matplotlib(二)
Matplotlib常用图形绘制Matplotlib绘制的常用图形包括散点图、线性图、柱状图、直方图、饼图、箱线图和子图。1.散点图散点图又称为散点分布图,是以利用坐标点(散点)的分布形态反映特征间的相关关系的一种图形。散点图的绘图函数为:scatter(x, y, [可选项])。其中x表示横轴坐标数据列,y表示纵轴坐标数据列,可选项包含颜色、透明度等。import pandas as pdimport numpy as npimport matplotlib.pyplot as pltpat原创 2020-05-14 16:45:52 · 1783 阅读 · 1 评论 -
金融数据分析与挖掘实战4.1 Matplotlib(一)
数据可视化包MatplotlibMatplotlib是Python中一个二维绘图包,能够非常简单的实现数据可视化。Matplotlib最早由John Hunter于2002年启动开发,其目的是为了构建一个Matlab式的绘图函数接口。在Anaconda发行版中已经集成了Matplotlib库,直接导入pyplot模块就可以使用了。导入方法为:import matplotlib.pyplot as pltimport matplotlib.pyplot as pltplt.figure(1)原创 2020-05-11 17:38:57 · 570 阅读 · 0 评论 -
Numpy包之矩阵
Numpy包 矩阵与线性代数运算Numpy的matrix是继承自NumPy的二维ndarray对象,不仅拥有二维ndarray的属性、方法与函数,还拥有诸多特有的属性与方法。同时,Numpy中的matrix和线性代数中的矩阵概念几乎完全相同,同样含有转置矩阵,共轭矩阵,逆矩阵等概念。一、创建Numpy矩阵Numpy中可使用mat、matrix或bmat函数来创建矩阵。使用mat函数创建矩阵时,若输入matrix或ndarray对象,则不会为它们创建副本。因此,调用mat函数与调用matrix(dat原创 2020-05-09 10:27:21 · 321 阅读 · 0 评论 -
Numpy包之数组
科学计算包Numpy一、 Numpy简介Numpy是Python用于科学计算的基础包,也是大量Python数学和科学计算包的基础。不少数据处理及分析包都是在Numpy基础上开发的,比如pandas包就是在其基础上开发的。Numpy的核心基础是ndarray(N-dimensional array,N维数组),即由数据类型相同的元素组成的N维数组。可利用Numpy包提供的数组定义函数arr...原创 2020-05-06 16:35:50 · 730 阅读 · 0 评论 -
Python 面向对象程序设计(一)
面向对象程序设计# 面向对象程序设计(英语:Object-oriented programming,缩写:OOP)是一种程序设计范型,同时也是一种程序开发的方法。#对象指的是类的实例。它将对象作为程序的基本单元,将程序和数据封装其中,以提高软件的重用性、灵活性和扩展性。类就是一组相似特征事物的统称。#面向对象程序设计可以看作一种在程序中包含各种独立而又互相调用的对象的思想,这与传统的思想刚好...原创 2020-04-27 11:12:14 · 466 阅读 · 0 评论 -
Python 函数(三)
一、返回值#使用return语句输出返回值,语法为return(value),可以返回一个值,也可以返回多个值#例:某商场打折促销活动,金额500~1000打九折,1000~2000打八折,2000~3000打七折,高于3000打六折def f1(money): '''功能:计算商品金额并计算折扣结果 money:保存商品金额列表 返回值:商品的合计金额...原创 2020-04-26 12:17:05 · 913 阅读 · 0 评论 -
Python 函数(二)
为参数设置默认值# 当定义函数里的部分参数没有传入参数值的时候,会报错,我们可以在定义函数的时候为参数设置默认值,设置默认值的参数放到最后面#采用发育情况的例子def f1(hight,weight,name = "路人"): '''name:姓名 hight:身高 weight:体重 ''' print(name + "的身高:"+ st...原创 2020-04-24 11:18:42 · 306 阅读 · 0 评论 -
Python 函数(一)
函数简单理解:函数就是可以完成某项工作的代码块。函数的创建和调用def functionname([parameterlist]): #参数[’’‘comments’’’] #注释[functionbody] #函数体#定义一个函数,功能为过滤指定字符(如颜色字符)def f1(string): '''功能:过滤到颜色的...原创 2020-04-21 11:48:25 · 291 阅读 · 0 评论