- 博客(39)
- 收藏
- 关注
原创 numpy数据计算基础
创建0到10之间1行20列的随机浮点数数组a,计算给定一维数组窗口大小为3的移动平均值,如输入[8,8,3,7,7,0,4],输出[6.33,6.0,5.67,4.67,3.67]创建2到10之间1行10列的随机数组a,将数组里面的数字全部替换成文本,替换规则如下:<5:小,5-7:中, >7:大。创建2到20之间1行30列的随机数组a和b,从数组a中删除在数组b中存在的所有元素,并输出。创建2到20之间1行30列的随机数组a和b,获取数组a和b之间的共同元素,并输出。从数组a提取5到10之间的所有元素。
2025-07-08 17:42:46
126
原创 模拟通讯录的数据添加功能。
(2)输入‘1’ 进行添加学生,输入姓名,如果该姓名已存在,则输出“Fail”的提示信息,如果不存在,继续输入电话和所在学院。dic={'张自强': ['12652141777', '材料'], '庚同硕': ['14388240417', '自动化'], '王岩': ['11277291473', '文法']}无论是否添加成功,结束后需要输出操作后的字典数据。(3) 如果输入其他选项,无需再读姓名,直接输出“ERROR”。
2025-07-08 17:23:43
102
原创 一个合法的身份证号码由17位地区、日期编号和顺序编号加1位校验码组成。校验码的计算规则如下:
首先对前17位数字加权求和,权重分配为:{7,9,10,5,8,4,2,1,6,3,7,9,10,5,8,4,2};然后将计算的和对11取余得到值Z;一个合法的身份证号码由17位地区、日期编号和顺序编号加1位校验码组成。现在给定一些身份证号码,请你验证校验码的有效性,并输出有问题的号码。
2025-07-08 17:22:22
98
原创 假设列表 lst_suit=[“黑桃“,“红桃“,“梅花“,“方块“],存放了扑克牌的花色。列表lst_face存放了扑克牌的牌面大小
(1)将以上两个列表进行元素搭配,生成一个新的列表 lst,存放所有牌面(不考虑大小王)。新的列表 lst 的内容为["黑桃 3","红桃 3","梅花 3",.......,"黑桃 2","红桃 2","梅花 2","方块 2"]。lst_face=['3','4','5','6','7','8','9','10','J','Q','K','A','2'],存放了扑克牌的牌面大小,其元素已按照牌面大小升序排列。假设列表 lst_suit=["黑桃","红桃","梅花","方块"],存放了扑克牌的花色。
2025-07-08 17:21:17
99
原创 凑硬币。如何使用1角、2角和5角的硬币凑出2块钱,注意组合中必须同时有1角、2角和5角。
如何使用1角、2角和5角的硬币凑出2块钱,注意组合中必须同时有1角、2角和5角。(2)输出第一个满足条件的组合就结束输出,跳出程序。(1)输出所有满足条件的组合。
2025-07-08 17:18:35
110
原创 读入一个列表,按照绝对值从大到小排序,如果绝对值相同,则正数在前面。例如列表[3,-4,2,4],排序后的结果为[4,-4,3,2]
读入一个列表,按照绝对值从大到小排序,如果绝对值相同,则正数在前面。例如列表[3,-4,2,4],排序后的结果为[4,-4,3,2]。建议使用list1=eval(input())直接读入一个列表。
2025-07-08 17:17:39
98
原创 英文辅音字母是除A、E、I、O、U以外的字母。本题要求编写程序,统计给定字符串中大写辅音字母的个数。
英文辅音字母是除A、E、I、O、U以外的字母。本题要求编写程序,统计给定字符串中大写辅音字母的个数。如:HELLO World!
2025-07-08 17:14:31
200
原创 123321是一个非常特殊的数,它从左边读和从右边读是一样的,我们称这样的数为回文数。 输入一个正整数n, 编程求所有这样的五位和六位十进制回文数,满足各位数字之和等于n(1<=n<=54)。
123321是一个非常特殊的数,它从左边读和从右边读是一样的,我们称这样的数为回文数。输入一个正整数n, 编程求所有这样的五位和六位十进制回文数,满足各位数字之和等于n(1<=n<=54)。按从小到大的顺序输出满足条件的整数。
2025-07-08 17:13:30
116
原创 输入一个字符串,再输入两个字符,求这两个字符在字符串中的索引
输入一个字符串,再输入两个字符,求这两个字符在字符串中的索引。在这里给出一组输入。例如:pmispsissippis p输出样例:11 p10 p8 s7 s5 s4 p3 s0 p提示:起始代码可以如下:str1 = input()a,b = input().split(" ")
2025-07-08 17:12:01
137
原创 循环,按照字符遍历字符串
输入一个正整数n,求出 1到n 的整数中 1 出现的次数。即求出任意非负整数区间中 1 出现的次数(从1 到 n 中1出现的次数)。例如:输入13,则1—13中出现6次1(分别在1,10,11,12,13中,注意11中有两个1)。
2025-07-08 17:10:50
160
原创 列表的排序
列表: [[ 'Angle', '0121701100106',99], [ 'Jack', '0121701100107',86], [ 'Tom', '0121701100109',65], [ 'Smith', '0121701100111', 100], ['Bob', '0121701100115',77], ['Lily', '0121701100117', 59]]。
2025-07-08 17:10:05
135
原创 十进制整数转二进制
输入一个整数n,输出其对应的二进制数。得到22的二进制是10110。提示:考查//和%符号的使用。11/2 5 余 1。5 /2 2余 1。2 /2 1余 0。1 /2 0余 1。22 / 2 11余0。
2025-07-08 17:05:44
117
原创 本题要求编写程序,将给定字符串去掉重复的字符后,按照字符ASCII码顺序从小到大排序后输出。
本题要求编写程序,将给定字符串去掉重复的字符后,按照字符ASCII码顺序从小到大排序后输出。提示:list()可以将字符串转换为列表,方便排序。输入样例:ad2f3adjfeainzzzv。set()可以对列表或字符串临时去重。输出样例:23adefijnvz。sort()可以对列表排序。
2025-07-08 17:03:45
90
原创 股票指标分析
摘要:研究基于CSMAR数据库2017-2018年22,720条季度每股指标数据展开。(1)计算每股收益同比增长率,筛选出连续4季度增长率>20%的股票;(2)提取各年每股资本公积/未分配利润TOP10股票,采用子图柱状图可视化;(3)对2018年6项指标进行主成分分析,提取信息占比≥95%的主成分并解释意义;(4)基于主成分进行K-means聚类,输出聚类中心。研究涉及财务指标分析、数据可视化、降维分析和聚类建模等方法,为股票财务特征研究提供量化分析框架。
2025-07-05 02:07:02
238
原创 个人信用等级评估算法实现
本研究通过数据预处理、重采样和模型训练,对银行贷款客户违约风险进行预测和分级。实验采用逻辑回归、随机森林和XGBoost三种模型,使用SMOTE方法处理数据不平衡问题。结果显示XGBoost模型表现最佳,AUC值最高。最终将客户按违约概率划分为A-H八个风险等级,为银行信贷决策提供依据。整个流程包括数据清洗、特征工程、模型训练和评估等环节,实现了从原始数据到风险评级的完整解决方案。
2025-07-05 01:25:29
162
原创 上市公司高送转预测在线实验闯关
返回结果用一个数据框B1来表示,其中列名分别为a_code(股票代码)、b(高送转标识:1-有高送转,0-无高送转)Stkcd(股票代码)、Accper(会计期间)、Indcd(行业代码)、F090101B(每股收益)、F091001A (每股净资产)、F091301A (每股资本公积)、F091501A(每股未分配利润)a_code(股票代码,与上一关对应),8个指标的字段名称依次用c、d、e、f、g、h、i、j来表示。Stkcd(股票代码)、Trddt(交易日期)、Clsprc(收盘价),
2025-07-05 00:29:36
949
原创 上市公司财务风险识别在线实验闯关
包括财务特征变量(自变量X),同时构造非风险标识变量(因变量Y=0),用一个数据框表示,记为B0。'''利用上一关的结果xz(自变量经过标准化、主成分分析和提取主成分后的特征数据)和y(因变量)盈利现金比率、总资产报酬率、净资产收益率、存货周转率、应收账款周转率、总资产周转率、提取的主成分记为xz,同时返回因变量y的值,其中xz和y均为numpy数组''''''在上一关的基础上,对自变量进行极差标准化,即数据隐射到[0,1]区间上,'''在上一关基础上,随机筛选出与风险企业数量相同的非风险企业,
2025-07-05 00:29:22
717
原创 上市公司透明度综合评价在线实验闯关
Y=pca.fit_transform(X) #满足累计贡献率为95%的主成分数据。pca=PCA(n_components=0.95) #累计贡献率为95%gxl=pca.explained_variance_ratio_ #贡献率。# 2.基于提取的主成分计算综合得分,综合得分=提取的主成分与其累计贡献率乘积之和、# 股票代码、会计期间、收益率、负债率、增长率、两权分离度、实际控制人性质、# 高管持股数量、股东总数、兼任情况 、董事人数(规模)、独立董事人数。
2025-07-05 00:29:05
234
原创 金融数据基础与计算在线实验闯关
Fs = home_appliance_df.set_index('股票代码')['股票名称']A=pd.read_excel('上市公司财务与指标数据2013-2017.xlsx')A=pd.read_excel('沪深300指数交易数据表.xlsx')A=pd.read_excel('沪深300指数交易数据表.xlsx')A=pd.read_excel('沪深300指数交易数据表.xlsx')A=pd.read_excel('沪深300指数交易数据表.xlsx')
2025-07-05 00:28:50
362
原创 股票联动与轮动布尔数据集构建在线实验闯关
1.读取交易日历数据表,记为td,并统计获得2017-01-01~12-31全年的实际交易天数M。# index为交易日期,字段名称所有股票的“股票简称_up”,值记为0或者1的布尔值数组。# 3.获得2017年全年均在交易(交易天数为M)的股票代码,用列表code来表示。#股票代码(Stkcd)、交易日期(Trddt)、收盘价(Clsprc)M=len(ddt) #计算ddt的长度,全年的实际交易天数M。#股票代码(Stkcd)、股票简称(Stknme)#交易日期(Clddt)、星期(Daywk)
2025-07-05 00:28:35
321
原创 上市公司综合能力聚类分析与量化投资检验在线实验闯关
1.在上一关基础上,以每一类股票作为投资组合,计算各投资组合持有期为2016-05-01~2016-12-31日的收益率。# 其中股票的收益率=(持有期最大交易日的收盘价-持有期最小交易日的收盘价)/持有期最小交易日的收盘价。# 5.返回聚类结果,用序列Fs来表示,index为股票代码、值为聚类标签值(0~4),# 4.对标准化后的指标值进行k-均值聚类分析,k=5,即聚为5类。# 投资组合的收益率=投资组合中持有期内各股票收益率之和。# 收盘价采用考虑现金红利再投资的收盘价可比价进行计算。
2025-07-05 00:28:12
407
原创 MA、MACD、KDJ、RSI、OBV相关指标计算及预测模型构建在线实验闯关
z[data1.iloc[1:,5].values-data1.iloc[0:-1,5].values==0]=0 #平。z[data1.iloc[1:,5].values-data1.iloc[0:-1,5].values<0]=-1 #跌。z[data1.iloc[1:,5].values-data1.iloc[0:-1,5].values>=0]=1 #涨。z[data1.iloc[1:,5].values-data1.iloc[0:-1,5].values<0]=-1 #跌。
2025-07-05 00:27:50
911
原创 上市公司综合排名及投资组合构建、收益率计算在线实验闯关
获取排名第 i 个股票代码 2017-05-01 至 2017-12-31 的交易,并按交易日期升序排序。# 2.投资组合持有期为2017-05-01日至2017-12-31日,计算其收益率。# 以该股票持有期内首个交易日考虑现金红利再投资的收盘价可比价p1买入,# 股票代码、会计期间、营业收入、营业利润、利润总额、净利润、资产总计、# 持有期内最后交易日的考虑现金红利再投资的收盘价可比价p2卖出,# 股票代码、交易日期、收盘价、考虑现金红利再投资的收盘价可比价、
2025-07-04 01:29:00
757
原创 上市公司净利润增长率的计算在线实验闯关
S=pd.Series(info.iloc[:,1].values,index=info.iloc[:,0].values)#预定义4个list,依次存放股票名称、2015年、2016年、2017年的净利润增长率。# 股票代码(Stkcd)、会计年度(Accper)、净利润(B002000101)# 股票代码(Stkcd)、股票简称(Stknme)、行业名称(Nnindnme)# 字段为“2015”、“2016”、“2017”,值为当年的净利润增长率。#将字典转化为数据框,index为股票名称。
2025-07-04 01:27:00
293
原创 基于布尔数据集的一对一和多对一关联规则挖掘
#请编程计算规则“A->B”和“A,B->C”的支持度和置信度,分别用sp1和co1,sp2和co2来表示。data = pd.read_excel('test12.xlsx') # 读取 Excel 文件。# 置信度:A、B 和 C 同时为 1 的行数 / A 和 B 同时为 1 的行数。# 置信度:A 和 B 同时为 1 的行数 / A 为 1 的行数。# 支持度:A 和 B 同时为 1 的行数 / 总行数。# 计算规则 A->B 的支持度和置信度。
2025-07-04 01:22:58
121
原创 布尔数据集构建
items=['西红柿','排骨','鸡蛋','茄子','袜子','酸奶','土豆','鞋子']#商品名称,也是数据框的字段名。## I1、西红柿、排骨、鸡蛋、毛巾、水果刀、苹果。## I3、鸡蛋、袜子、毛巾、肥皂、苹果、水果刀。## I8、土豆、鸡蛋、袜子、香蕉、苹果、水果刀。## I9、西红柿、排骨、鞋子、土豆、香蕉、苹果。## I6、鸡蛋、茄子、酸奶、肥皂、苹果、香蕉。## I4、西红柿、排骨、茄子、毛巾、水果刀。## I7、排骨、鸡蛋、茄子、水果刀、苹果。# 初始化一个空的数据框。
2025-07-04 01:21:18
240
原创 K均值聚类算法及其应用
最后,给出聚类分析结果,用一个序列Fs来表示,其中index为地区名称,值为所属类别的标签值(0、1、2、3)。#读取“农村居民人均可支配收入来源2016.xlsx”数据表,数据来源于2016年《中国统计年鉴》,data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')# 首先,对指标数据作均值-方差标准化处理,注意首列为地区名称,不用标准化。Fs=pd.Series(c,index=data['地区'])# 其次,对标准化后的指标数据,作K-均值聚类分析(K=4),
2025-07-04 01:20:38
177
原创 基于主成分分析的综合评价
最后,基于综合得分获得各地区的排名,得分按从高到低排序,用一个序列Rs来表示,其中index为地区名称,值为综合得分。#读取“农村居民人均可支配收入来源2016.xlsx”数据表,其中数据来源于2016年《中国统计年鉴》,data=pd.read_excel('农村居民人均可支配收入来源2016.xlsx')#其次,其次对标准化处理后的指标数据作主成分分析,要求提前累计贡献率在95%以上。#再次,基于提取的主成分计算综合得分,综合得分=提取的各主成分与对应贡献率之和。
2025-07-04 01:19:53
184
原创 支持向量机回归模型及其应用
并针对测试数据AT=28.4、V=50.6、AP=1011.9、RH=80.54,预测其PE值。#基于上一关的数据集,构建支持向量机回归模型(采用线性核函数),返回计算结果模型的拟合优度r,data=pd.read_excel('发电场数据.xlsx')
2025-07-04 01:19:03
198
原创 神经网络回归模型及其应用
并针对测试数据AT=28.4、V=50.6、AP=1011.9、RH=80.54,预测其PE值。data=pd.read_excel('发电场数据.xlsx')#基于上一关的数据集,构建神经网络回归模型,返回计算结果模型准确率r,
2025-07-04 01:18:20
206
原创 线性回归模型及其应用
3)今有某次测试数据AT=28.4、V=50.6、AP=1011.9、RH=80.54,试利用构建的线性回归模型预测其PE值。# 1)求出PE与AT、V、AP、RH之间的线性回归关系式系数向量,用列表b表示,其元素依次为常数项、对应变量系数。#在发电场中电力输出(PE)与AT(温度)、V(压力)、AP(湿度)、RH(压强)有关,data=pd.read_excel('发电场数据.xlsx')# 2)求出回归方程的拟合优度(判定系数),用变量r表示。
2025-07-04 01:17:37
183
原创 神经网络分类模型及其应用
X1=np.load('X1.npy') #经过缺失值填充、数值变量标准化后的数据集,numpy数组690*15。#在上一关基础,对经过缺失值填充、数值变量标准化后的数据集,取前600条记录作为训练数据,后90条记录作为测试数据。Y=np.load('Y.npy') #因变量,numpy数组,690个元素。#构建神经网络分类模型,返回计算结果模型准确率rv和预测准确率r。
2025-07-04 01:16:41
192
原创 逻辑回归模型及其应用
X1=np.load('X1.npy') #经过缺失值填充、数值变量标准化后的数据集,numpy数组690*15。#在上一关基础,对经过缺失值填充、数值变量标准化后的数据集,取前600条记录作为训练数据,后90条记录作为测试数据。Y=np.load('Y.npy') #因变量,numpy数组,690个元素。#构逻辑回归模型,返回计算结果模型准确率rv和预测准确率r。
2025-07-04 01:15:52
97
原创 支持向量机分类模型及其应用
X1=np.load('X1.npy') #经过缺失值填充、数值变量标准化后的数据集,numpy数组690*15。#在上一关基础,对经过缺失值填充、数值变量标准化后的数据集,取前600条记录作为训练数据,后90条记录作为测试数据。Y=np.load('Y.npy') #因变量,numpy数组,690个元素。#构建支持向量机模型,返回计算结果模型准确率rv和预测准确率r。
2025-07-04 01:13:58
125
原创 缺失值填充
读取“银行贷款审批数据.xlsx”表,自变量为x1~x15,决策变量为y(1-同意贷款,0-不同意贷款)# 请对x1~x6中存在的缺失值用均值策略填充,x7~x15用最频繁值策略填充。data=pd.read_excel('银行贷款审批数据.xlsx')# 最后返回填充处理后的X(即x1~x15),以及决策变量Y(即y)# 对名义变量(x7 - x15)使用最频繁值策略填充缺失值。# 对数值变量(x1 - x6)使用均值策略填充缺失值。# 其中x1~x6为数值变量,x7~x15为名义变量。
2025-07-04 01:03:11
268
1
原创 上市公司新闻标题情感识别在线实验闯关
x_train_counts = count_vect.fit_transform(X) #用来对数据进行处理,表示成n-gram的形式。#1.基于上一关的结果trainX_txt,Y,testX_txt,利用机器学习包的内置函数,#2.最后,利用训练好的模型,对testX_txt进行预测,返回测试集的情感分类标签值。#对上一关获得的分词后的训练集trainX_txt和测试集testX_txt,# 同步骤2,对测试集中的标题进行分词,分词后的结果为testX_txt。
2025-07-04 00:52:20
669
原创 数据标准化
categorical_vars = data.iloc[:, 6:15] # x7 到 x15。numerical_vars = data.iloc[:, 0:6] # x1 到 x6。#在上一关的基础上,对自变量X中的数值变量(x1~x6)作均值-方差标准化处理。# 对名义变量(x7 - x15)使用最频繁值策略填充缺失值。# 对数值变量(x1 - x6)使用均值策略填充缺失值。# 需要注意的是x7~x15名义变量不需要作标准化处理。
2025-07-04 00:38:15
231
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人