前
好久没写博客了,因为最近在忙别的事情,事情比较多就不想写东西了
所以没在比赛结束的时候直接写总结,拖到了现在
最后的结果是忘记写附录、忘记提交代码和附件了,最终只有三等奖的成绩,这里没有怪我队友的意思,其实有队员记错比赛时间应该所有人都有责任的。
好了,正经说说我们的解法吧,要是觉得特别差劲请嘴下留情。
以下只写我给队友的readme.txt的文件的内容吧,其他的不放了,想要的可以联系我。
中
我们选的是B题。
第一问是“数字经济”板块的主要指标,我们用的是PCA的做法。
对于第一问我们做了数据的处理,并且使用PCA实现了主成分分析。
readme.txt:
有一个特征值叫ARBR 它后面缺失的比较多 就直接把这个特征值舍弃掉了
剩下的采用的SPSSPro里面的按照线性趋势填充缺失值
数据处理的时候要把“数字经济版块信息”中的5min求平均到每一天赋值
归一化就是(a[i]-min)/(max-min)的值
然后用程序把有所有指标的日期都整理到一个表(final中),预处理结束。
PCA是调用的sklearn里面的API,PCA求权重是用的SPSSPro
求权重的根据是这个链接
https://www.jianshu.com/p/f4d8597f3906
剩下要写的可能要结合PCA的原理啥的了
第二问队友找到了LSTM的模型,我发现是个多参数的求最值的问题,考虑用PSO(粒子群)算法,于是给出了pso-lstm的模型
readme.txt:
PSO(粒子群算法)不是可以解决像 f(x1,x2,x3)=****,其中x1∈(),x2∈(),x3∈()这种很多个变量的函数的最值嘛
变量:
可以给它设置7×47个xi,因为有7个指标嘛,每个指标又有47个5min间隔的时间组成,把第1个时间的这个指标的值设成附件中给的那个
形式化来说:xij表示第i

本文讲述了作者及其团队在数字经济竞赛中的经历,使用PCA进行主成分分析处理数据,并结合LSTM和PSO算法求解多参数问题。文章分享了关键步骤、数据处理技巧及团队合作的反思,适合对机器学习应用于经济预测感兴趣的读者。
最低0.47元/天 解锁文章
1万+





