- 博客(20)
- 收藏
- 关注
原创 国赛数模C题模型(五)
熵权法:(1)熵:指标的信息熵。信息熵描述所有可能发生事件的不确定性。 (2)权:指标的权重,描述指标的重要程度。 (3)熵权法:通过计算因素或指标的信息熵来确定它们的权重,最后得出得分。[外链图片转存中…(img-6GBbREev-1725369641540)][外链图片转存中…(img-vNV1G7op-1725369641540)][外链图片转存中…(img-ECmmv34N-1725369641540)]
2024-09-03 21:22:04
908
原创 爬虫数据解析
解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储进行指定标签的定位标签或者标签对应的属性中存储的数据值进行提取(解析)
2024-09-02 17:16:30
1872
原创 国赛数模C题模型(四)
多元回归分析是研究多个变量之间的关系的回归分析方法,是反映一种现象或事物的数量依多种现象或事物的数量的变动而相应地变动的规律,建立多个变量之间线性或非线性数学模型数量关系式的统计方法。***①逐步回归的定义:***逐步回归的基本思想是通过剔除变量中不太重要又和其他变量高度相关的变量,降低多重共线性程度。①回归分析的定义:是指利用数据统计原理,对大量统计数据进行数学处理,并确定因变量与某些自变量的相关关系,建立一个相关性较好的回归方程(函数表达式),并加以外推,用于预测今后的因变量的变化的分析方法。
2024-08-29 21:25:38
1035
原创 国赛数模C题模型(三)
主成分分析(PCA)是在损失很少信息的前提下,把。(3)计算相关系数矩阵R的特征值和特征向量。(2)计算变量之间的相关系数矩阵,记为R。多个指标转化为少数几个综合指标。(5)计算出主成分及综合得分。,转化生成的综合指标称之为。进行分析的方法,也称之为。处理,消除量纲的影响。(4)写出主成分的个数。(1)对原始数据进行。
2024-08-29 18:05:57
401
原创 国赛数模C题模型二
①概念:决策树是一种有监督的机器学习算法,该方法可以用于解决分类和回归问题。决策树可以简单地理解为达到某一特定结果的一系列决策。②优点:(1)计算复杂度不高,输出结果易于理解 (2)一次构建可以反复使用③缺点:容易产生过拟合问题聚类分析:Q型聚类、R型聚类。
2024-08-29 14:30:20
861
原创 国赛数模C题模型(一)
②常用的卡方检验:(1)单因素卡方检验/卡方拟合度检验 (2)二因素卡方检验/独立性卡方检验。:皮尔逊相关系数,也叫线性相关系数,用于进行线性相关分析,当数据满足正态分布时会使用该系数。①卡方检验:卡方检验用于检测观察到的类别变量的分布是否与期望的不同。(1)提出假设:零假设:期望值和观测值之间没有显著性差异。:当数据不满足正态分布时,使用该系数。(1)变量特性可以通过绘制散点图判断。②数据中心对数比变换(CLR)判断相关性大小(主要是r值)判断是否相关(主要是p值)③相关性系数判定方法。
2024-08-28 20:10:19
671
原创 数模国赛——数据统计类赛题
①数据归约:对数据集进行处理,以减少数据的维度,同时保留数据集的关键特征和信息。①删除含有缺失值的记录(适用于缺失数据量不大且不影响整体数据分布的情况)(a)数值型数据:平均值/中位数(考虑数据分布情况选择填充策略)①基于统计方法的异常值检测:(a)3sigema原则。①清洗对象:缺失值、无关值、重复值、异常值。(a)使用特定的数据标识符或组合列检测重复。①数据清洗(删除处理无关/缺失/异常值)③不处理(可以证明缺失值存在的合理性)④数据变换(规范化、离散化、数字化)(b)分类型数据:通常使用众数填充。
2024-08-23 19:53:44
612
1
原创 数模国赛论文书写(按模型分类二)
① 插值法的分类:(a)分段线性插值(b)Hermite插值(c)样条插值(d)拉格朗日插值(e)牛顿插值(a)(b)(c)为分段类型的插值 (d)(e)为一段类型的插值②龙格现象:(d)(e)数据点越多,插值得出的函数的次数越高,而高次多项式会在插值区间内发生严重的震荡现象,造成较大的误差。
2024-08-23 19:11:07
358
原创 数模国赛论文书写(按模型分类一)
①近代博弈论发展史②博弈论一般定义:在一定的游戏规则约束下,基于直接相互作用的条件下,各参与人依据所掌握的信息,选择各自的策略,以实现利益最大化的过程。③博弈的分类:*分类一:*按是否合作合作博弈(参与人之间对各方有一个约束力协议,参与人之间在协议中博弈)非合作博弈(静态博弈:参与人各方同时行动或虽并非同时行动但后者不知道前者采取了什么具体行动动态博弈:行动有先后顺序,后者可以观察到前者的选择,并对此做出相应选择*分类二:*按参与人对其他参与者信息掌握不同。
2024-08-23 15:43:04
562
原创 蓝桥杯——递归与递推
思路:1. 顺序任意 2. 每个格子最多按一次 3. 第一行状态固定后,第二行的操作被第一行的灯的亮暗状态所唯一确定 4. 最后一行的状态无法更改,因此需要进行一个特判看该方案是否可行。细节:1. 如何枚举第一行的操作(递归实现指数型枚举)(使用二进制从0到32枚举一遍)2. 如何进行操作:偏离量配合坐标 3. 时间复杂度 32。第三层n(n-1)个分支,每个分支里面到 n n。个分支,每个分支里面到 n n!第二层n个分支,每个分支里面到n n。第一层一个分支,每个分支里面到n n。
2024-02-28 20:05:21
504
原创 美赛论文写作II
维多利亚时代的历史野火数据、纬度、经度和其他数据都来自权威网站,如澳大利亚联邦选举委员会和美国宇航局的官方网站,而且精度很高。如果是对对模型中的参数形式或者分布进行假设,可以在正文中运用实际数据进行画图或者检验。澳大利亚维多利亚州的官方网站被查询,获得了大量关于野火的数据。引用别人的文献或者资料。
2024-02-27 19:13:16
1058
原创 美赛(论文手)
简要概括建了什么模型(模型的名字要起的有特点)(精准、概括性强)(一般来说,“基于…的…模型”这种起名方法比较常见)简述建模的过程,如果算法出彩,放在模型介绍后一并介绍(说明模型和算法的时候,挑重点说)(关键步骤、关键变量、关键算法)(在不影响读者阅读的情况下,语言越精炼越好)说明得到的结果(结果较少可以全写上去;结果较多,举例说明)(摘要里面不能出现表格、图片)关键词可以是问题、模型、算法等,一般5-6个。摘要里面可以进行加粗(模型名称、算法名称、关键变量、模型结果)
2023-12-17 20:08:41
988
1
原创 算法基础课 第六章 贪心
思路:将每个区间按右端点从小到大排序 从前往后依次枚举每个区间 如果当前区间中已经包含点,则满足不用管,否则,选择当前区间的右端点。
2023-11-26 16:45:33
489
1
原创 算法基础课 第四章 数学知识
每一个状态的SG:每一个状态通过一次操作可以变成k个局面的SG值的不能到的最小自然数。a/b是一个整数不是小数 希望找到一个数使得a/b同余于a*x(mod m)算法思路:筛素数 求每个质数的次数 用高精度乘法把所有的质因子乘到一起。从前往后看,将每一个数的所有倍数删除,删除完后,所有剩下的数都是质数。u(n):表示1-n中与n互质的数的个数。容斥原理:1-2+3-4+5…+(-1)^n-1*n。1-n中p的倍数的个数:n/p下取整。求1-N中与N互质的数的个数。例题:满足条件的01序列。
2023-11-23 22:24:56
1982
原创 算法基础课 第二课 数据结构
思路:开始栈为空,i每往右边移动一个位置就往栈中加入一个数,因此栈中存的数为a1,a2…解题思想:先把原字符串所有前缀的哈希值求出来,再求两个区间的哈希值,如果两个区间的哈希值相同则两个区间相同,反之不同。哈希数字时可能出现冲突,哈希字符串时完全不考虑冲突的情况 p=131或13331,q为二的十次方,不会出现冲突。看成一个p进制的数,将p进制的数转化成10进制的数,在模上一个较小的数。已知1-L-1的哈希值和1-R的哈希值,求L-R的哈希值。字符串哈希的作用:(K进制的角度将字符串看成数字)
2023-10-24 20:45:33
102
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅