
数据挖掘
文章平均质量分 85
木得感情的野指针
吉林大学一资深学渣---------情感抑制模块启动,停止对敌人的嘲讽。
展开
-
数据挖掘期末大作业附加题
数据挖掘期末大作业附加题一、前提说明:课程开始时间大概为:2020.10.10;结束时间大概为:2021.1.7;当课程进行到一半时,时间大概为:2020.11.24号;此时,还没有开始进行平时考试,没有计算数据,所以我打算使用四次平时考试的成绩和一次期末考试成绩来预测我们要求的期末成绩。数据集太少我们额外加上期末考试的数据,当做一次普通考试,并且将排名改为等级,由低到高分为四个等级,分别的A,B,C,D,他们的占比分别为:10%,20%,30%,40%。我建立的这个模型只能通过四次成绩预测一下,他们期原创 2021-01-20 18:36:00 · 2999 阅读 · 2 评论 -
吉林大学 数据挖掘期末大作业 第二题报告
一、操作说明:根据第一题我们在这里使用Class10中的sheet6“成绩详情”,讨论一下不同成绩之间的关系。我们首先对数据进行处理,去掉SID,五级制等级,综合成绩和证书发放四个列,这里用到了数据集成。剩下的有五个列,我们不用全部讨论,我们使用数据规约,进行主成分分析,对进行分析后的列再次处理。最后先进行k-means聚类分析,得到最终结果。二、代码data=read.xlsx(“F:\数据包\Class10.xlsx”,6)#删除不需要的列data <-data[ , !names(da原创 2021-01-16 22:45:22 · 3581 阅读 · 1 评论 -
数据挖掘之数据预处理,吉林大学数据挖掘作业第一题
一共有三种文档,每种分别取一种作为例子1.入学信息预处理:代码:data=read.csv("F:\\数据包\\入学信息.csv", header = TRUE)#判断有无缺失值sum(is.na(data))#数据离散化str(data)for(i in 1:501){if(data[i,4]=='英语'){data[i,4]="YES";}else {data[i,4]="NO";}}#将更新后的数据写入文件中data <- rename(data,c(外语语种 =原创 2021-01-15 21:36:36 · 2159 阅读 · 10 评论