数据分析
文章平均质量分 69
xia0ya
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R语言绘图过程中遇到图例的图块中出现字符“a“的解决方法
因为我遇到这个问题的时候没在网上找到合适的方法,找到个需要付费的,算了。也许是因为问的方式不同,问了半天AI也回答出来,莫名有些烦躁,打算对代码做个分析,没想到很快就出结果了,这个记得一些知识还是很有必要的,从网上找,有时候比较费时间。那里,明显多出来个a,经过我们对数据的检查发现没有问题。这个地方对应的就是图例图块里是否有显示,原创 2024-11-22 16:11:53 · 1130 阅读 · 1 评论 -
横截面数据回归
线性回归模型中,如果残差服从正态分布,则可以认为模型是合理的。P值不是万能的,好的模型还是要不断试一试才能出来。回归是否有意义,还是要放在实际背景中去看。原创 2024-07-04 10:07:06 · 1911 阅读 · 0 评论 -
R语言数据质量分析
数据质量分析是数据预处理的,也是数据分析结论和的基础。数据质量分析的主要任务是检查原始数据中是否存在脏数据。脏数据一般包括;原创 2024-03-19 23:51:10 · 1468 阅读 · 1 评论 -
复杂网络分析(day1)
复杂网络分析是一种研究网络结构和动态行为的方法。复杂网络包括了许多连接和相互作用的节点,这些节点可以是人、物体、信号或其他系统的组成部分。在复杂网络分析中,我们可以通过分析网络的拓扑结构、节点的属性和相互关系等方面来理解网络的性质和行为。以下是一些复杂网络分析的示例:社交网络分析:对社交网络中的关系进行分析,探查社交网络中的群体结构、节点的中心度、社交影响力等。网络流动性分析:分析物流、交通或信息网络中节点和边的流动性,研究网络的拥塞、传播效率等问题。蛋白质相互作用网络分析。原创 2024-03-14 23:27:55 · 1254 阅读 · 1 评论 -
K-均值聚类算法
是一种常用的无监督学习算法,用于将一组数据分成K个不同的簇。该算法基于以下假设:每个簇的中心点,也称为质心,是该簇中所有数据点的平均值。该算法通过迭代计算来更新每个簇的质心位置,以最小化簇内成员与质心之间的距离平方和。初始化K个质心的位置。对每个数据点,计算其与每个质心之间的距离,将其归类到最近的质心所属的簇。更新每个簇的质心位置为该簇内所有数据点的平均值。重复步骤2和步骤3,直到质心位置不再改变或达到最大迭代次数。:该算法简单且易于理解和实现,适用于初学者。原创 2024-03-12 17:24:52 · 884 阅读 · 1 评论 -
python模拟高考录取
定义投档状态和录取状态的字典# 遍历每个考生# 初始化投档状态,将每个志愿的投档状态全部置为Falseadmission_status[row['考生编号']] = {j:False for j in range(1,9)}# 遍历每个志愿,找到可以投档的志愿major = row[f'志愿def admission(df , plans_dict) : # 定义投档状态和录取状态的字典 admission_status = {原创 2024-03-08 19:57:21 · 2110 阅读 · 1 评论
分享