- 博客(10)
- 收藏
- 关注
原创 1013 数素数 (20分)
1013 数素数 (20 分)令 Pi表示第 i 个素数。现任给两个正整数 M≤N≤10^4 ,请输出 PM到 PN的所有素数。输入格式:输入在一行中给出 M 和 N,其间以空格分隔。输出格式:输出从 PM到 PN的所有素数,每 10 个数字占 1 行,其间以空格分隔,但行末不得有多余空格。输入样例:5 27输出样例:11 13 17 19 23 29 31 37 41 4347 53 59 61 67 71 73 79 83 8997 101 103在这里我觉得根本用不
2020-12-18 13:52:20
139
原创 数据挖掘第九周周报
数据挖掘第九周周报1、本周工作主要是进行在数据集的基础上进行模型融合与参数设置,经过处理以后得到了base_info.csv和entprise_info.csv的merge数据集,2、首先我先按照了训练赛的模型去训练我的数据集,但是效果不是很明显,可能是参数的问题,于是我放弃使用了学习赛的模型,转而百度了LGBM模型单独进行训练,然后是试着手动调节参数,根据手动调节的参数进行提交结果,虽然在自己本地有0.8443的结果,但是线上只有0.76:3、对于线上线下差别这么大,我感觉应该是过拟合了,.
2020-11-23 12:43:44
324
原创 *数据挖掘第八周周报*www
数据挖掘第八周周报1、本周工作主要是进行新的比赛,首先做的是对数据集的分析。刚开始看到数据集不只是一个表格感到有点麻烦,但是看到几个数据集之中的数据之后,我还是只是选择一个base.csv文件进行训练,对于base集,数据集1:base_info.csv包含数据集7和8中涉及到的所有企业的基本信息,每一行代表一个企业的基本数据,每一行有33列,其中id列为企业唯一标识,列之间采用“,”分隔符分割。数据格式如下:[id:企业唯一标识, oplocdistrict:行政区划代码, industr.
2020-11-17 20:35:30
578
原创 **数据挖掘第七周周报*
数据挖掘第七周周报1、本周工作 主要是和大家讨论交流以后,花时间去了解了baseline的方法和实现。看到lgboost和xgb和cat等方法,同时也了解了baseline的方法和特征工程和数据预处理以及模型调参2、baseline的代码风格很好,把几个模型都集中在了一个函数里面,其中的库调用也让我受益很多。def lgb_model(x_train, y_train, x_test): lgb_train, lgb_test = cv_model(lgb, x_train, y_tr.
2020-11-09 19:36:46
221
原创 数据挖掘第六周周报
数据挖掘第流周周报1、本周工作本周主要是添加了PLA线性感知算法python版本,打算与神经网络、,KNN一起对数据处理,对测试集进行了分类,但是由于在PLA分类中,对于数据量太大的情况,对于PLA的权值更新有很大的阻碍,迟迟没办法收敛,我现控制一下权值迭代的次数,但是多次下来发现耗时太大,效果也不好,所以暂时没有用PLA作为分类。 W=np.ones(cols)#initial all weight with 1 count=0 while True: count.
2020-11-02 10:29:40
261
原创 *数据挖掘第五周周报**
数据挖掘第五周周报1、本周工作本周主要是添加了knn算法python版本,与神经网络一起对数据处理,对测试集进行了分类,并得到了结果。如图所示:得到了比上周稍微好一点的结果,说明knn+神经网络的作用还是有的,但是在自己挑选出来的验证集上的结果比这个rank上的结果要好很多就让人捉急了。。。2、本周上课学到的降维方法暂时还没有怎么用,主要是还在尝试不同的K和不同的迭代次数,然后看看要不要在加上几个弱分类器。3、最后遇到的问题就是验证集上的结果与实际rank差距有点大,自己应该好好挑.
2020-10-26 09:29:45
158
原创 数据挖掘第四周周报
数据挖掘第四周周报1、本周工作本周主要是实现了神经神经网络在数据集上的初步运用,在经过主观降维的数据集处理以后,对测试集进行了分类,并得到了结果。如图所示:得到了不是0.5的结果,说明神经网络的作用还是有的,但是在经过对于迭代次数的改变和训练集的改变以后,还是没有能优化到一个更好的结果,于是乎我在考虑是不是应该回过头对特征工程进行进一步的处理,于是这一周的后几天我都是在处理数据集的特征,链接: https://zhuanlan.zhihu.com/p/43225794.在知乎和谷歌的.
2020-10-18 21:10:41
260
原创 数据挖掘第三周周报
数据挖掘第三周周报1、本周工作本周主要是学习了python在数据挖掘的应用,在本周的学习中,学了 很多关于python的用法,包括对csv文本的读入、对矩阵数据的提取,对矩阵数据的分析、对矩阵列的删减、对矩阵空值的填补与剔除,对数据的归一化和标准化等。对数据的提取、矩阵的删减:trainFile = "O:/DataBaseOfPython/train.csv"testAFile = "O:/DataBaseOfPython/testA.csv"pwd = os.getcwd(.
2020-10-09 20:44:58
242
原创 数据挖掘第二周周报
本周由于要学习python来进行数据处理,所以导致进度有点慢,在Rink方面只能是用到的是c++版的1NN,所以结果很不理想,本周着重的是学习使用python去处理数据,在安装python环境方面又踩了不少坑,在百度的帮助下也是花了不少功夫摸索,从https://blog.youkuaiyun.com/guoziqing506/article/details/52014506这个网址中学习python对文件的读写,从https://zhuanlan.zhihu.com/p/66050679中可以学习到机器学习中,数据预
2020-10-05 22:28:58
222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人